PLoS ONE: Genomisk Kopier Antall Variasjoner i genomene til Leukocytter Tippe Prostate Cancer Clinical Outcomes

Abstract

Nøyaktig prediksjon av prostata kreft kliniske kursene fortsatt ukjent. I denne studien utførte vi hele genomet kopi nummer analyse på leukocytter av 273 pasienter med prostatakreft som bruker Affymetrix SNP6.0 chip. Kopier nummer variasjoner (CNV) ble funnet på tvers av alle kromosomene av det menneskelige genom. Et gjennomsnitt på 152 CNV fragmenter per genom ble identifisert i leukocytter fra prostatakreftpasienter. Størrelses distribusjoner av CNV i genomet av leukocytter var svært samsvarende med prostatakreft aggressivitet. En prostatakreft utfall anslagsmodell ble utviklet basert på store størrelsen forhold på CNV fra leukocytt-genomer. Denne spådommen modellen generert en gjennomsnittlig prediksjon rate på 75,2%, med sensitivitet på 77,3% og spesifisitet på 69,0% for prostatakreft tilbakefall. Når det kombineres med Nomogram og status for fusion transkripsjoner, ble den gjennomsnittlige spådommen satsen økt til 82,5% med sensitivitet på 84,8% og spesifisitet på 78,2%. I tillegg leukocytt forutsigelse modellen var 62,6% nøyaktig forutsi kort prostata spesifikt antigen doblingstiden. Når det kombineres med Gleason sin klasse, Nomogram og status for fusion transkripsjoner, prediksjon modellen genereres en korrekt prediksjon sats på 77,5% med 73,7% sensitivitet og 80,1% spesifisitet. Så vidt vi vet, er dette den første studien som viser at CNVs i leukocytter genomer er prediktive for kliniske utfall av et menneske malignitet

Citation. Yu YP, Liu S, Huo Z, Martin A, Nelson JB, Tseng GC , et al. (2015) Genomisk Kopier Antall Variasjoner i genomene til Leukocytter Tippe Prostate Cancer Kliniske resultater. PLoS ONE 10 (8): e0135982. doi: 10,1371 /journal.pone.0135982

Redaktør: Zoran Culig, Innsbruck Medical University, ØSTERRIKE

mottatt: 24 april 2015; Godkjent: 28 juli 2015; Publisert: 21 august 2015

Copyright: © 2015 Yu et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet: All relevant data er i avisen og dens saksdokumenter filer. Rådata informasjon om SNP6.0 fra disse prøvene ble avsatt i Gene Expression Omnibus (GEO, tiltredelse antall GSE70650)

Finansiering:. Denne studien ble støttet av et stipend fra National Cancer Institute for å JHL (RO1 CA098249) og et stipend fra University of Pittsburgh Cancer Institute. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Prostatakreft er en av de viktigste årsakene til dødsfall for menn i USA. Den har betydelig heterogenitet i biologisk aggressivitet og klinisk prognose [1-3]. Siden innføringen av serum PSA screening, har den kliniske oppklaringsprosenten av prostatakreft er økt vesentlig skyldes først og fremst til identifisering av små, lave karakteren kreft som ville sannsynligvis ikke fremgang [1]. Likevel, i nærheten av 30.000 pasienter dør av prostatakreft hvert år [4]. Nøyaktig anslag av den aggressive oppførselen til prostatakreft fortsatt ukjent.

Foreløpig flere behandlingstilbud tilgjengelig for pasienter med prostatakreft inkludert vaktsom venter, stråling, hormonelle /chemo-terapi og radikal prostatektomi. Gleason gradering alene eller i kombinasjon med andre kliniske indikatorer som serum prostata spesifikt antigen nivåer og patologisk eller klinisk staging har vært det styrende verktøy i å velge disse behandlingsalternativene. Et betydelig antall pasienter med prostatakreft, men opplevde tilbakefall etter kirurgisk reseksjon av prostata. Det er åpenbart behov for bedre prediksjon av prognose av prostatakreft. Forrige cytogenetisk og andre genom studier antydet en klar sammenheng mellom genom misdannelser og prostatakreft [5-21]. Nylige analyser av genomet kopiantallet av prostatakreft, godartet vev tilstøtende til kreft og blodprøver fra pasienter med prostatakreft antydet at genomet sletting og forsterkning av visse regioner i prostatakreft prøver ble forbundet med dårlige kliniske resultater [14; 22]. Hele genomet og transkriptom sekvensering avslørt fusion transkripsjoner i prostatakreft prediktiv av prostatakreft tilbakefall [23]. I denne studien, utførte vi hele genomet kopitall analyser på leukocytter fra prostata kreftpasienter. Vesentlige kopi antall variasjoner (CNV) ble identifisert i genomet av leukocytter i prostatakreftpasienter. Vi fant at størrelsene på CNVs i leukocytter av prostatakreft prøvene var sterkt korrelerende med prostatakreft tilbakefall. Prediksjonsmodeller ble bygget for å forutsi prostatakreft utfall basert på størrelsen av CNVs av leukocytter.

Materialer og metoder

Protokollen av studien ble godkjent av University of Pittsburgh Institutional Review Board.

Tissue behandling, DNA-ekstraksjon, fragment generasjon, merking, hybridisering, vasking og scanning av SNP 6,0 chips

prostatakreft prøvene ble hentet fra University of Pittsburgh Medical Center Tissue Bank. Disse prøvene ble samlet 1998-2012. To hundre syttitre buffy coat-prøver fra pasienter med prostatakreft ble analysert. Blant disse prøvene, ble 143 prøver fulgt i minst 90 måneder, 35 pasienter var ikke-tilbakevendende i 90 måneder eller mer, 55 pasienter opplever tilbakefall med kort PSADT (PSA dobling tid 4 måneder), og 53 pasienter opplever tilbakefall med lang PSADT (PSA dobling tid 15 måneder) etter radikal prostatektomi (S1 tabell). Den Gleason er scorene til alle prostatakreft prøvene ble revurdert ved UPMC patologer før studien. Klinisk oppfølging ble utført av kontoret undersøkelse posten, blod PSA undersøkelse og røntgen oppfølging. Disse oppfølginger ble utført i opptil 15 år etter at pasienten hadde en radikal prostatektomi. Protokollen ble godkjent av «University of Pittsburgh Institutional Review Board». Fem hundre ng genomisk DNA ble spaltet med Sty1 og Nsp1 i 2 timer ved 37 ° C. Spaltet DNA ble renset og ligert med adaptere primer /ved 16 ° C i 12-16 timer. Amplikonene ble samlet ved utførelse av PCR ved anvendelse av primere som tilbys av produsenten (Affymetrix, CA) på ligerings produkter ved hjelp av følgende program: 94 ° C i 3 minutter, og deretter 35 sykluser ved 94 ° C på 30 sekunder, 60 ° C i 45 sek og 65 ° C i 1 minutt. Dette ble etterfulgt av forlengelse ved 68 ° C i 7 min. PCR-produktene ble deretter renset og spaltet med DNaseI i 35 minutter ved 37 ° C for å fragmentere det amplifiserte DNA. Den fragmenterte DNA ble deretter merket med biotinylerte nukleotider via terminal deoksynukleotid-transferase i 4 timer ved 37 ° C. To hundre og femti mikrogram fragmentert DNA ble hybridisert med en pre-ekvilibrert Affymetrix chip SNP 6,0 ved 50 ° C i 18 timer. Prosedyrer for vasking og scanning av SNP 6,0 chips fulgt håndbøkene som fulgte med Affymetrix, Inc. Rådata informasjon om SNP6.0 fra disse prøvene ble avsatt i «Gene Expression Omnibus» (GEO, tiltredelse antall GSE70650).

statistisk analyse

Kopier nummer variasjon analyse.

CEL filer ble analysert med Genotyping Console for kvalitetskontroll analyse. Prøver med QC samtale over 80% og QC kontrast ratio over 0,4 ble tatt inn i analysen. Å analysere CNV, ble CEL filer importert til Partek GenomeSuite 6.6 til å generere kopi nummer fra rå intensitet. For å plotte histogram, sletting eller forsterkning av genomer ble analysert ved første begrensende til regionene med p-verdi mindre enn 0,001. De utvalgte regioner ble deretter filtrert ved å begrense til regionene med minst 10 markører og 2 kb i størrelse. Regionene ble deretter kartlagt kjente gener. Frekvensene for amplifisering og delesjoner ble plottet for å genomet svarer til de steder genet (figur 1A). For hvert gen, ble Fishers eksakte test brukt for å teste sammenhengen mellom CNV engasjement og prøve tilbakefall status. Da minus log p-verdiene ble plottet på Manhattan tomt med tilhørende genet kromosom steder å generere fig 1B. Benjamini-Hochberg (BH) metode ble anvendt for å korrigere p-verdiene. De CNV-genet beriket trasé ble valgt av Kolmogorov-Smirnov test på gense justert p-verdier. Pathway p-verdier ble også korrigert av BH-metoden.

(A) Histogram av frekvens av forsterkning (rød) eller sletting (blå) av genomsekvenser av leukocytter (øvre panel, n = 273) fra prostatakreftpasienter . (B) Manhattan plott av p-verdier i forbindelse med prostatakreft tilbakefall av hvert gen CNV fra leukocytter.

Maskinlæringsmetoder for å forutsi tilbakevendende og raskt tilbakevendende status.

konstruert prediksjonsmodeller for to typer kliniske sammenligninger: (1) ikke-tilbakevendende versus tilbakevendende; (2) ikke-rask tilbakevendende (dvs. ikke-tilbakevendende eller tilbakevendende, men å ha prostata spesifikt antigen dobling tid [PSADT] ≥15 måneder) versus rask tilbakevendende (residiverende PSADT≤ 4 måneder). For hver sammenligning ble modellene konstruert ved hjelp Gleason score (G), Nomogram score (N), fusion transkripsjon status (F) eller blod CNV informasjon (L) separat. For Gleason scorer diskriminering, brukte vi binær prediksjon (0 betydning Gleason score ≤ 7 og en mening Gleason score 7). For Nomogram score, ble det 7 års overlevelse sannsynlighet hentet fra https://www.mskcc.org/nomograms/prostate brukt [24]. For fusjon status, søkte vi åtte fusion transkripsjoner (TRMT11-GRIK2, SLC45A2-AMACR, mTOR-TP53BP1, LRRC59-FLJ60017, TMEM135-CCDC67, KDM4-AC011523.2, MAN2A1-FER og CCNU-C5orf30) tidligere identifisert og validert i en multisenterstudie [23]. En binær sammensmelting resultatet ble anvendt (0 betyr ingen av de åtte fusjonene detekterte, 1 betyr en eller flere fusjons transkripter påvises). For prediksjon ved hjelp av genet CNV av leukocytter, fant vi lite prediktiv kraft fra gen-basert forening (fig 1B). Som et resultat, har vi utviklet en stor størrelse ratio (LSR) modell basert på antagelsen om at ikke-målrettede CNV avvik i blod spilt en betydelig rolle i disponerende prostatakreft til aggressivitet. Som vist i figur 2A, ble LSR definert som andelen av store størrelse CNV identifisert i blodet genomet av en gitt pasient, hvor stor størrelse ble definert av terskel δ. I hver to-fold kryssvalidering, ble prøver tilfeldig og delt likt i to datasett. I det første datasettet behandlet som treningsdataene ble de beste δ parameter i LSR-modell og de beste cutoffs av nomogrammet og LSR score valgt ved å maksimalisere den høyeste AUC (areal under kurven) og Youden indeks (det vil si sensitivitet + spesifisitet-1). Modellene ble så påført på den andre datasettet som testdata. Den kryssvalidering ble deretter gjentatt ved bruk av andre datasettet som treningsdata, og det første datasettet som testdata. ROC-kurver ble plottet ved å variere konsentrasjon i både trening og testing av datasettene. Den tilsvarende generelle nøyaktighet, sensitivitet, spesifisitet, Youden indeks og AUC ble beregnet til å evaluere resultatene. Lik-splitting validering ble gjentatt for 14 ganger og toppen to og bunn 2 splitting med høyest og lavest sum av AUC ble fjernet for å unngå uhell ekstrem trening /testing oppdrag. De gjenværende 10 kryssvalideringsresultater ble til slutt gjennomsnitt (tabell 1 og tabell 2). ROC og Kaplan-Meier overlevelseskurver i figurene 3-6 er de representative resultatene av de 10 spådommer nærmest gjennomsnittsverdier.

(A) Skjematisk fremstilling av LSR modell av leukocytter CNV. (B) LSR fra leukocytter er assosiert med aggressiv prostatakreft tilbakefall atferd. Øvre panel: Korrelasjon av LSR fra leukocytter genomer med prostatakreft som var tilbakevendende; Nedre panel: Korrelasjon av LSR fra leukocytter genomer med prostatakreft som var engangs 90 måneder etter radikal prostatektomi. (C) LSRs fra leukocytter er forbundet med korte PSADT. Øvre panel: Korrelasjon av LSR fra leukocytter genomer med prostatakreft som hadde tilbakevendende serum prostata spesifikt antigen dobling tid (PSADT) 4 måneder eller mindre; Nedre panel: Korrelasjon av LSR fra leukocytter genomer med prostatakreft som ikke ble tilbakevendende eller tilbakevendende, men har PSADT 15 måneder eller mer

(A) LSR avledet fra leukocytter genom CNV spår prostatakreft tilbakefall.. Mottaker opererer kurve (ROC) analyser ved hjelp av LSR avledet fra leukocytt CNVs som prediksjon parameter (rød) for å forutsi prostatakreft tilbakefall, versus Nomogram (blå), Gleason er Karakter (grønn) og status for 8 fusion transkripsjoner [14] (gule). Prøvene ble delt likt tilfeldig inn i trening og testing sett 10 ganger. ROC analyse representerer resultatene fra den mest representative splittet. (B) Kombinasjon av LSR (L), til Gleason er Karakter (G), Nomogram (N) og status for fusion transkripsjoner (F) spår prostatakreft tilbakefall. ROC-analyse av en modell som kombinerer LSR, fusion transkripsjoner, Nomogram og Gleason sin klasse bruker LDA er angitt med svart. ROC-analyse av en modell som kombinerer fusion transkripsjoner, Nomogram og Gleason sin klasse bruker LDA er angitt med rødt. ROC-analyse av en modell som kombinerer LSR, fusion utskrifter og Gleason sin klasse bruker LDA angis med blått. ROC-analyse av en modell som kombinerer LSR, fusion utskrifter og Nomogram ved hjelp LDA er indikert med grønt. ROC-analyse av en modell som kombinerer LSR, Nomogram og Gleason sin klasse er angitt med gult. Lignende tilfeldige splittelse av trening og testing datasett ble utført som av (A).

Kaplan-Meier analyse på pasienter spådd av LSR basert på CNV av pasientenes leukocytter som sannsynlig tilbakevendende versus sannsynlig engangs (øverst til venstre). Ligner overlevelse analyser ble også utført på case segregations basert på Gleason karakterer (øvre middel), Nomogram sannsynlighets (øverst til høyre), status for 8 fusion transkripsjoner (nederst til venstre), eller en modell ved å kombinere LSR, Nomogram og fusjon transkripsjon status ved hjelp av LDA (lavere midten), eller en modell ved å kombinere LSR, Nomogram, Gleason grade og fusjon transkripsjon status ved hjelp av LDA (nederst til høyre). Antall prøver analysert og p-verdiene er angitt.

LSR stammer fra leukocytter genom CNV spår PSADT 4 måneder eller mindre. ROC analyse ved hjelp av LSR avledet fra leukocytt CNVs som en forutsigelse parameter (rød) for å forutsi PSADT 4 måneder eller mindre, versus Nomogram (blå), Gleason er Karakter (grønn) og status for 8 fusion transkripsjoner [14] (gule). Prøvene ble analysert ved hjelp av den samme prosedyre som fig 3. (B) Kombinasjon av LSR (L), Gleason største grad (G), Nomogram (N) og status for fusjons transkripter (F) for å forutsi prostatakreft tilbakevendende PSADT 4 måneder eller mindre . ROC-analyse av en modell som kombinerer LSR, fusion transkripsjoner, Nomogram og Gleason sin klasse bruker LDA er angitt med svart. ROC-analyse av en modell som kombinerer fusion transkripsjoner, Nomogram og Gleason sin klasse bruker LDA er angitt med rødt. ROC-analyse av en modell som kombinerer LSR, fusion utskrifter og Gleason sin klasse bruker LDA angis med blått. ROC-analyse av en modell som kombinerer LSR, fusion utskrifter og Nomogram ved hjelp LDA er indikert med grønt. ROC-analyse av en modell som kombinerer LSR, Nomogram og Gleason sin klasse er angitt med gult.

Kaplan-Meier analyse på pasienter spådd av LSR basert på CNV av pasientenes leukocytter som sannsynlig gjennomgående og ha PSADT 4 måneder eller mindre versus sannsynlig engangs eller tilbakevendende, men har PSADT 15 måneder eller mer (øverst til venstre). Ligner overlevelse analyser ble også utført på case segregations basert på Gleason karakterer (øvre middel), Nomogram sannsynlighets (øverst til høyre), status for 8 fusion transkripsjoner (nederst til venstre), eller en modell ved å kombinere LSR, Nomogram og fusjon transkripsjon status ved hjelp av LDA (lavere midten), eller en modell ved å kombinere LSR, Nomogram, Gleason grade og fusjon transkripsjon status ved hjelp av LDA (nederst til høyre). Antall prøver analysert og p-verdiene er angitt.

For å teste om å kombinere flere datainformasjon forbedrer prediksjonen resultat, søkte vi lineær diskriminant analyse (LDA) for å kombinere to eller flere prediktive faktorer. Alle mulige kombinasjoner ble utført. Modeller som bruker (1) L + N + F (2) L + N + G (3) N + F + G (4) L + F + G (5) L + N + F + G er vist i figur 3 og 5.

Kaplan-Meier kurve analyse

for å overleve evaluering (figur 4 og 6), kombinert vi to-fold kryssvalidering av «Training = Testing». resultatet for å sammenligne resultatene for ulike metoder, med unntak av Gleason score som vi brukte (≤7 VS 7 som cut-off for hele prøvene). Kaplan-Meier-kurver ble avkortet med 90 måneders oppfølging. Log-rank test ble utført for å beregne p-verdi mellom overlevelseskurvene for to predikerte utfall. For å vurdere om overlevelse forskjell for en modell var betydelig bedre enn den andre, definerer vi en teststatistikken U som den absolutte forskjell på log-rank test statistikk fra de to modellene. Teoretisk under nullhypotesen (to modellene var ikke diskriminant), teststatistikken U fulgte en fordeling av absolutt forskjell på to uavhengige chi-kvadrat (frihetsgrad = 1) distribusjoner. Som et resultat, vi samplet 10.000.000 ganger fra den absolutte forskjell mellom to uavhengige chi-squared distribusjoner å danne null distribusjon og vurdere p-verdier.

Resultater

Genome kopiere abnormiteter er noen av de kjennetegnene for prostatakreft. Men lite er kjent om kopi unormalt genom i ikke-cancerous vev fra pasienter med prostatakreft. For å analysere regionene av forsterkning og delesjon i genomet av leukocytter fra prostatakreftpasienter, ble 273 buffy coats fra prostatakreftpasienter analysert for CNV på tvers av hele genomet ved hjelp av Affymetrix SNP6.0. Bruke cutoff kriterier for størrelse ≥2 Kb, men da antall ≥ 10 og p 0,001, ble totalt 41589 CNV fragmenter identifisert, inkludert 24213 segmenter av sletting og 17 376 av forsterkning, som involverer 17865 gener basert på Partek genet merknaden (fig 1A ). Dette betyr et gjennomsnitt på ca 152 CNVs per prøve. Den gjennomsnittlige størrelsen på CNV i genomet av leukocyttene er omtrent 147 Kb. I gjennomsnitt ble 256 gener funnet å ha enten kopiantall gevinst eller tap per genom. Blant de 273 blodprøver, 143 blodprøver har mer enn 90 måneder med kliniske oppfølging i form av prostatakreft tilbakefall. Interessant, da kategorisere blodprøver basert på status for prostatakreft tilbakefall, CNV av leukocytter fra pasienter som opplevde tilbakefall etter radikal prostatektomi hadde et gjennomsnitt på 3,2 ganger større størrelse på CNV versus CNV fra pasienter som hadde ingen tilbakefall i minst 90 måneder. Tosidig t-test viste en sterk sammenheng mellom størrelsen på CNV i leukocytter og prostata kreft tilbakefall (p = 2,2 x 10

-16), noe som tyder på at størrelsen på kjønnsceller CNV kan spille en betydelig rolle i disponerende prostatakreft mot aggressive kliniske kurs. Men ingen spesifikk (FDR = 0,05) gen som er involvert i CNV av genomet fragment når grensen som skiller tilbakevendende prostatakreft versus de av engangs (fig 1B). Sammen tyder resultatene på at genet-basert prediksjon modellen er lite sannsynlig å lykkes i leukocytter CNV analyse, men størrelsesfordelingen av CNVs kan være logisk.

For å undersøke om kjønnsceller CNV er prediktiv for tilbakefall av prostatakreft, en algoritme benytter forhold mellom antallet av stor størrelse-fragmenter ble utviklet. Som illustrert i figur 2A, for hver prøve, det store størrelse forholdet (LSR) er definert som forholdet mellom CNV fragmenter hvis størrelse er større enn en størrelse cutoff (δ) over det totale antall CNV fragmenter. For eksempel er tre av de syv detektert CNVs i figur 2A funnet «store størrelse fragmenter» (størrelse ≥ A) og den LSR av denne pasienten er beregnet som 3/7 = 0,43. I figur 2B, fordelingen av LSR fra pasienter som opplevde prostata kreft tilbakefall viste signifikant høyere verdier enn de som ikke opplever tilbakefall. Tilsvarende fordeling av LSR fra pasienter med raskt tilbakefall (PSADT≤ 4 måneder) var signifikant høyere enn de fra ikke-raske tilbakevendende pasienter (engangs eller tilbakevendende, men har PSADT≥ 15 måneder, Fig 2C). I LSR-modellen, er størrelsesterskelen δ bestemt ved å maksimere AUC. Når S verdier ble optimalisert (S1 figur, δ = 10

4,5 = 31 622 bp for tilbakevendende prediksjon modell og 1B valgt δ = 10

5,7 = 501 187 bp for rask tilbakevendende prediksjon), det spår prostatakreft tilbakefall med nøyaktighet 77,6%, med sensitivitet på 80,4% og spesifisitet på 68,6%, mens raske tilbakefall med nøyaktighet på 62,4%, med sensitivitet på 72,9% og spesifisitet på 54,1%.

for å validere denne modellen, 143 blodprøver (S1 Table) fra prostatakreftpasienter ble tilfeldig delt inn i et treningssett (72 prøver) og en testsett (71 prøver). Den store størrelse cutoff δ optimalisert og LSR-cutoff ble oppnådd fra treningen analyse ved å maksimere Youden indeksen. Parametrene ble deretter påført på testdatasettet for å vurdere prediksjonsnøyaktigheten. Valideringen ble så gjentatt 14 ganger og den beste 2 og verste to ble fjernet for å unngå ekstreme randomisering. De resterende 10 resultater fra disse opplærings- og testanalyser ble beregnet (tabell 1). Som vist i figur 3A (representative analyser i Tabell S2) og tabell 1, treningen nøyaktigheten av LSR modell for å forutsi prostatakreft tilbakefall når 76,5%, med 77,8% sensitivitet og 72,4% spesifisitet. Når parameterne ble påført på testsettet, når prediksjonsnøyaktigheten 73,9%, med 76,8% sensitivitet og 65,6% spesifisitet. Disse prediksjon prisene er bedre enn de av Nomogram (66,0% nøyaktighet for opplæring og 61,3% for testing, tabell 1), og er betydelig høyere enn de av Gleason grad er med singel cutoff (40,3% for opplæring og 39,4% for testing; p = 8.6×10

-3 for trening og p = 5.8×10

-3 for testing av ROC sammenligning se tabell 1 og S3 tabell).

for å undersøke om kombinasjon av ulike modaliteter vil forbedre prediksjon modell, blod LSR, Nomogram, Gleason er klasse og status for 8 fusion transkripsjoner (TRMT11-GRIK2, SLC45A2-AMACR, mTOR-TP53BP1, LRRC59-FLJ60017, TMEM135 -CCDC67, KDM4-AC011523.2, MAN2A1-FER og CCNU-C5orf30 ) [23] i prostata kreft prøvene ble samlet gjennom lineær diskriminant analyse (LDA) å trene prediksjon modellen i treningssettet. En slik modell genereres en prediksjon nøyaktighet på 87,9%, med 88,8% sensitivitet og 85,4% spesifisitet for prostatakreft tilbakefall i treningssettet, og nøyaktigheten av 75,7%, med 81,7% sensitivitet og 64,0% spesifisitet i testsettet (Fig 3B og Tabell 1). Interessant, kombinasjonen av LSR, Nomogram og status for fusjons transkripter synes å gi de beste prediksjonsresultater: 86,4% nøyaktighet i treningssettet og 78,6% nøyaktighet i testsettet. Disse prediksjon priser vises betydelig bedre enn de som genereres fra en enkelt modalitet (tabell 1). For å evaluere bidraget fra hver av disse modaliteter til kombinasjonsmodellen, subtraksjon av en av hver modalitet på et tidspunkt ble gjort på modellen for å evaluere deres virkninger respektivt. Som vist i figur 3B og Tabell 1, subtraksjon av LSR modalitet syntes å ha den mest betydelig innvirkning på prediksjon av prostatakreft tilbakefall: prediksjonsnøyaktigheten prisene falle fra 87,9% til 75,1% (ROC p = 0,044, se S3 Table) i treningssett og fra 75,7% til 64,0% (ROC p = 0,037) i testsett. Dette ble etterfulgt av fusjonsgen (p-verdi mellom de to ROC-kurver var 0,109 for trening og 0,159 for testing). På den annen side, subtraksjon av Nomogram eller Gleason grad hadde ingen nevneverdig innvirkning på prediksjon ytelse av modellen (tabell 1, figur 3 og S3 tabell).

For å undersøke prediksjon ytelse av LSR score på PSA- overlevelse av pasienter med prostatakreft, Kaplan-Meier analyser ble utført på 143 pasienter som hadde definitiv klinisk informasjon (S1 Table). Tilbakefall status for testprøver ble spådd av modellen trent fra treningssettet, og prediksjon modell av opplæring prøver ble trent fra testing sett. Det fusjonerte to-fold kryssvalidering prediksjonsresultater ble brukt til å dele de 143 pasientene i spådd tilbakevendende gruppe og ikke-tilbakevendende gruppe. Som vist i figur 4, når pasientene ble forutsagt av LSR som høy risiko for prostatakreft tilbakefall, bare 12,1% av pasientene som overlevde i 90 måneder uten tilbakefall, mens mer enn 52,3% av pasientene med LSR modell forutsagt å være sannsynlig ikke-tilbakevendende overlevde 90 måneder uten noen tegn til tilbakevendende prostatakreft (gjennomsnitt p = 9,9 x 10

-5 av log-rank test, fig 4 og S4 tabell). I kontrast, Gleason score klarte å produsere statistisk signifikante forskjellige resultater for tilbakevendende og ikke-tilbakevendende grupper (p = 0,113 ved log-rank test). Nomogram imidlertid generert statistisk signifikant bedre kliniske resultater (33,9% versus 18,4% overlevelse og p = 0,0038 for log-rank test) når pasientene ble segregert basert på predikert tilbakevendende versus engangs av nomogram. Når fusion karakterutskrifter, leukocytter genomet LSR og Nomogram ble kombinert, det bedret resultatene av prostatakreft prediksjon til 58,1% PSA overlevelse hvis de ble spådd å være ikke-tilbakevendende av modellen versus 16,9% hvis de ble spådd som sannsynlig tilbakevendende ved den kombinerte modellen (p = 2.9×10

-6 for de to overlevelseskurver). Dette kombinert-modalitet modell utkonkurrerer noen enkelt modalitet prediksjon modellen signifikant (p = 6.6×10

-3 versus LSR, p = 1.8×10

-5 versus Gleason, p = 3.5×10

-4 versus Nomogram, p = 0,017 versus fusion transkripsjoner, se S5 tabell). Når Gleason gradering ble lagt inn i modellen, det gjorde ikke forbedre nøyaktigheten av prediksjon, men forbedret overlevelseskurver.

Prostatakreft dødsfall er nært forbundet med økende hastighet av tilbakevendende Seral Ptil. Kort PSADT ( 4 måneder) hadde blitt brukt som et surrogat for prostatakreft dødsfall for de siste 15 årene [25; 26]. For å undersøke om LSR i genomet av leukocytter er også prediktive for kort PSADT ble blodprøver (S1 tabell) tilfeldig delt inn i trening (65 prøver) og testing (64 prøver) sett. Lignende prosesser ble utført på disse prøver som beskrevet i tilbakefall prediksjon. Som vist i tabell 2, ga LSR modellen i opplæring og testing datasett en nøyaktighet på prediksjon av PSADT = 4 måneder som 67,7% og 57,5%, henholdsvis. ROC kurven av LSR modellen kontra diagonal linje (tilfeldig gjetning) har p-verdi = 0,016 for treningssettet og 0,017 for testing settet (fig 5, Tabell 2 og S6 tabell). Prediksjon basert på Gleason score gitt 42,3% nøyaktighet for treningssett, og 44,5% for testing datasettet. På den annen side, Nomogram genereres en forutsigelse nøyaktighet på 67,8% og ROC p-verdi på 0,0082 i treningssettet og 64,5% nøyaktighet og 0,0014 ROC p-verdi i testsettet. Statusen fusion transkripsjoner i prostatakreft prøvene produsert en nøyaktighet på 68,8% og 68,4% i trening og testing datasett, henholdsvis. Disse 4 metoder så ikke ut til å være betydelig bedre enn en annen når parvise andel testene ble utført. Men når alle 4 metoder ble kombinert, det ga en nøyaktighet på 83,0% (ROC p = 5,3 x 10

-9) for treningssett og 72,0% (ROC p = 1.3×10

-4) for testing sett. Disse resultatene var bedre enn noen enkelt prediksjon modalitet i form av nøyaktighet, AUC og Youden indeksverdier (tabell 2). For å undersøke virkningen av hver av disse modaliteter for prediksjon modellen, ble hver modalitet individuelt subtrahert fra den kombinerte forutsigelse modell. Forslaget Resultatene viste en rekke 72,8 til 82,5% nøyaktighet i treningsdatasettet og 65,0 til 73,6% nøyaktighet i testdatasettet, når en modalitet ble trukket. Interessant, da enten blod LSR eller kreft fusjon transkripsjon status ble trukket fra, de kombinerte modellene ga ingen signifikant bedre prediksjoner enn noen enkelt modalitet prediksjon bortsett Gleason-tallet (S7 Table), noe som tyder på at blod LSR og fusjon avskrift status var de viktigste bidragsyterne i den kombinerte prognosemodellen.

for å analysere virkningen av kort PSADT prediksjon på prostatakreft PSA-fri overlevelse, Kaplan-Meier analyser ble utført på prøver er adskilt basert på PSADT prediksjon av leukocytter genom LSR. Som vist i figur 6 og tabell S8, når prøvene forutsett av blod LSR å ha PSADT≤4 måneder, PSA-overlevelse var 17,1% ved 90-måneder etter radikal prostatektomi, mens overlevelsesraten forbedret til 41,5% for de som er forutsagt å ha PSADT≥15 måneder eller engangs (log-rank test p = 0,0039, se figur 6 og S8 tabell). I kontrast, overlevelseskurver spådd av Gleason score endte opp med tilsvarende overlevelsesrate på 90 måneder, og p-verdi mellom to kurvene var 0,0816 ved log-rank test. Nomogram hadde PSA-fri overlevelse på 21,4% når pasientene ble spådd å ha PSADT≤4 måneder. Dette overlevelse var 31,5% når pasientene ble spådd å være ikke-tilbakevendende (p = 0,0021 ved log-rank test). Men når modellen kombinerer Gleason, Nomogram, fusion utskrifter og blod LSR ble brukt, Ptil-overlevelse var bare 7,9% når pasientene ble spådd å ha PSADT≤4 måneder, mens overlevelsen var 52,1% når pasientene spådd å ha PSADT 4 måneder eller engangs (p = 1.6×10

-7). Modellen kombinerer 4 modaliteter betydelig bedre enn de prediksjonsmodeller basert på Gleason grad (p = 1.5×10

-6) eller Nomogram (p = 3.0×10

-5) eller LSR (p = 1.9×10

-5 ) eller fusjon transkripsjoner (p = 0,0018) alene (S9 tabell). Disse analysene indikerer klart at størrelsene på kopiantallet variasjon av humane leukocytter er korrelative med klinisk virkemåten av prostatakreft. Kombinasjonen av genomet CNV av leukocytter med kliniske opplysninger av prostatakreftpasienter vil gi mye bedre prediksjonsmodeller for prostatakreft oppførsel.

Diskusjoner

Omfattende tilstedeværelse av CNV er en av de viktigste funksjonene i menneskelige kreftformer. CNV i normale vev hos friske individer ble også godt dokumentert [14; 27; 28]. Siden CNV analyse er stort sett ufølsom for liten forurensning, kan det kreves mer enn 25% urenheter for å detektere en endring av kopiantall i genomet. Liten forurensning av blodet ved prostatakreftceller er generelt uoppdaget. Den CNVs oppdaget fra buffy strøk i vår studie representerer sannsynligvis genomet CNVs fra leukocytter. Våre studier tyder på at størrelsene på CNV fra leukocytter av prostatakreftpasienter er svært samsvarende med de kliniske resultatene av prostatakreft. Disse CNVs sprer seg over alle kromosomene. cross-validations).

doi:10.1371/journal.pone.0135982.s017

(DOCX)

Acknowledgments

We

Legg att eit svar