PLoS ONE: Discovery og validering av en prostatakreft Genomisk Klassifiserings at Spår Tidlig metastaser etter radikal prostatektomi

Abstract

Formål

Clinicopathologic funksjoner og biokjemisk tilbakefall er sensitiv, men ikke spesifikk, prediktorer for metastatisk sykdom og dødelig prostatakreft. Vi hypotese at en genomisk uttrykk signatur påvises i primærtumor representerer sann biologisk potensial for aggressiv sykdom og gir bedre prediksjon av tidlig prostatakreft metastaser.

Metoder

En nestet case-kontroll design ble brukt for å velge 639 pasienter fra Mayo Clinic svulst registret som gjennomgikk radikal prostatektomi mellom 1987 og 2001. En genomisk klassifikator (GC) ble utviklet ved å modellere differensial RNA uttrykk ved hjelp av 1,4 millioner har høy tetthet uttrykk rekker av menn beriket for stigende PSA etter prostatektomi, inkludert 213 som opplevde tidlig klinisk metastaser etter biokjemisk tilbakefall. En trening sett ble brukt til å utvikle en tilfeldig skog klassifikator av 22 markører for å forutsi for tilfeller – menn med tidlig klinisk metastaser etter stigende PSA. Utførelse av GC ble sammenlignet med prognostiske faktorer som Gleason score og tidligere genekspresjonssignaturer i en tilbakeholdt valideringssettet.

Resultater

Expression profiler ble samlet inn 545 unike pasientprøver, med median føl- opp fra 16,9 år. GC oppnådde et område under mottaker drift karakteristikk på 0,75 (0,67 til 0,83) i validering, gått kliniske variabler og gen signaturer. GC var den eneste signifikante prognostisk faktor i multivariable analyse. Innenfor Gleason score grupper, saker med høy GC score opplevd tidligere død av prostatakreft og redusert total overlevelse. Markørene i klassifikator ble funnet å være assosiert med en rekke sentrale biologiske prosesser i prostata kreft metastatisk progresjon av sykdommen.

Konklusjon

En genomisk klassifikator ble utviklet og validert i en stor pasient kohort beriket med prostatakreft metastase pasienter og en stigende PSA som gikk på å oppleve metastatisk sykdom. Denne tidlige metastase prediksjon modell basert på genomisk uttrykk i den primære svulsten kan være nyttig for identifisering av aggressiv prostatakreft

Citation. Erho N, Crisan A, Vergara IA, Mitra AP, Ghadessi M, Buerki C, et al. (2013) Discovery og validering av en prostatakreft Genomisk Klassifiserings at Spår Tidlig metastaser etter radikal prostatektomi. PLoS ONE 8 (6): e66855. doi: 10,1371 /journal.pone.0066855

Redaktør: Chad Creighton, Baylor College of Medicine, USA

mottatt: 04.02.2013; Godkjent: 10 mai 2013; Publisert: 24 juni 2013

Copyright: © 2013 erho et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble støttet delvis av National Research Council of Canada, Industrial Research Assistance Program (https://www.nrc-cnrc.gc.ca/eng/irap/index.html), og Mayo Clinic prostatakreft SPORE P50 CA91956 ( PI:. Donald Tindall Ph.D.) de organer hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser: forfatterne har lest journalen politikk og har følgende konflikter: NE, AC, IV, MG, CB, ZH, BZ, TS, TT, og ED er ansatte i GenomeDx Biosciences Inc. ED og TT eget lager i GenomeDx biovitenskap Inc. ED har fått forskningsmidler fra GenomeDx biovitenskap Inc. og National Research Council – Industrial Research Assistance Program. PB har fått forskningsmidler fra GenomeDx Biosciences Inc. GK har fått forskningsmidler fra Beckman Coulter. KB, EB, RC, SF, RK, RJ, og TK har erklært at ingen konkurrerende interesser eksisterer. Dette endrer ikke forfatterne tilslutning til alle PLoS ONE politikk på deling av data og materialer.

Innledning

Over 240 000 mennesker er diagnostisert med prostatakreft i USA årlig, og et flertall av dem havnen lokal eller regional sykdom der den langsiktige prognosen er god [1]. Omtrent halvparten av disse mennene gjennomgå radikal prostatektomi (RP) og nesten 40% vil presentere seg med en eller flere clinicopathologic funksjoner som høy Gleason score (GS), ekstra kapsel forlengelse (ECE), positive kirurgiske marginer (SM +), sædvæske invasjon (SVI), eller spredning til lymfeknuter (N +) som er forbundet med økt risiko for klinisk metastase [2] – [4]. Selv om bare et fåtall av disse mennene er virkelig i fare for å dø av kreft deres [5], mange av disse «klinisk høy risiko» pasienter vil motta ytterligere postoperative tiltak (f.eks adjuvant stråling) og ofte lider behandling sykelighet. Omvendt, mange menn presentere uten uønskede kliniske funksjoner og likevel dø av prostatakreft. Dagens verktøy har begrenset kapasitet til å identifisere, ved RP, menn som er mest utsatt for metastase og prostatakreft død – slike pasienter er for tiden behandles aggressivt bare etter observasjon av stigende PSA (prostata spesifikt antigen) eller biokjemisk tilbakefall (BCR) . Nyere kliniske studier tyder på at disse pasientene ville trolig ha mer gunstige utfall hvis behandlet tidligere post-RP [6] – [10]. Dermed blir begrenset ytelse av kliniske faktorer for å forutsi menn med høyest risiko for metastasering fører til suboptimal behandling av pasienten.

I løpet av det siste tiåret, mange studier har forsøkt å løse udekkede klinisk behov for å forutsi aggressiv prostatakreft ved hjelp av individuelle biomarkører eller genekspresjonssignaturer [11] – [30]. Imidlertid har disse tidligere forsøk ikke sett omfattende bruk i klinisk praksis, fordi ingen av dem har overbevisende demonstrert bedre prediksjon i løpet av etablerte kliniske faktorer slik som GS. Dette er hovedsakelig på grunn av begrensninger i utvalgsstørrelse og makt, den lange klinisk oppfølging er nødvendig for å observere metastatisk eller dødelige prostatakreft hendelser og bruk av BCR som et surrogat endepunkt; en følsom, men ikke-spesifikk, prediktor for sykdomsprogresjon [31]. Dermed fleste biomarkør studier dårlig utvalg klinisk bevist aggressive prostatakrefttilfeller. I tillegg ble de fleste genekspresjonssignaturer utviklet med analyser som kreves fersk eller frossen vev, som ikke er rutinemessig tilgjengelig i klinisk praksis, og var begrenset til profilering proteinkodende gener – undersøker bare et mindretall av den aktive genomet (dvs. transkriptom) . I en tidligere rapport innhentet vi arkivert formalinfiksert parafin innebygd (FFPE) primært prostatakreft prøvene fra Mayo Clinic svulst register som inkluderte et stort antall pasienter som utviklet metastatisk sykdom. Med langsiktig oppfølging vi konstatert en biomarkør signatur som kan identifisere menn i faresonen for progresjon til klinisk metastase og dødelig prostatakreft [20]. Men i valideringen vi ikke viser en betydelig forbedring på ytelsen i forhold til kliniske variabler, og vi en hypotese om at dette kan være på grunn av begrenset fokus på et sett av ca 1000 proteinkodende gener.

Her er vi utvide på dette arbeidet ved å re-profilering av pasientene i den opprinnelige studie hvor en høy tetthet transkriptomet bred microarray som vurderer ekspresjon av mer enn 1,4 millioner RNA-funksjoner, inkludert de ~22,000 kjente protein-kodende gener, så vel som mange tusener av ikke-kodende RNA. Slike ikke-kodende RNA er nå anerkjent for sin evne til å regulere aktiviteten av onkogener og tumorsuppressorgener involvert i utviklingen av sykdommen tilbakefall og metastatisk progresjon [32], [33]. Vi presenterer utvikling og validering av en genomisk klassifikator (GC) for risiko prediksjon av tidlig klinisk metastaser som er beriket i ikke-kodende RNA. Vi viser at GC gir uavhengig og statistisk signifikant prognostisk informasjon utover clinicopathologic variabler og vise at GC utkonkurrerer tidligere rapportert gen signaturer.

Materialer og metoder

pasientpopulasjon og Kliniske resultater

pasienter fra denne studien ble valgt ved hjelp av en nestet case-kontroll design fra Mayo Clinic radikal prostatektomi Tumor registeret, som beskrevet tidligere [20]. I korte trekk, ble pasienter som fikk radikal prostatektomi (RP) for primær prostatahyperplasi adenokarsinom som førstelinjebehandling ved Mayo Clinic Comprehensive Cancer Center mellom 1987 og 2001 i ettertid klassifisert i følgende utfall grupper:

Ingen bevis av sykdom (NED) progresjon gruppe

. Utstilt ingen biokjemiske eller andre kliniske tegn på sykdomsprogresjon etter RP, med minst 7 års oppfølging

prostata-spesifikt antigen (PSA) -recurrence gruppe

: erfaren biokjemiske gjentakelse (BCR), definert som to påfølgende økning i PSA-målinger over 0,02 ng /ml (med påfølgende måle 0,05 ng /ml over den første måle) uten påvisbare klinisk metastasering (se nedenfor) innen 5 år BCR

klinisk metastase gruppe (metastase)

. Erfarne BCR og utviklet regionale eller fjernmetastaser, bekreftet ved skanning bein eller CT, innen 5 år BCR. Denne gruppen ble kalt Systemisk Progresjon (

SYS

) i vår tidligere studie [20].

Totalt 213 pasienter møtte definisjonen av metastase gruppe, og ble utpekt som saker [20]. For hvert tilfelle ble en pasient hver fra PSA og NED grupper valgt basert på de samsvarende kriteriene som er beskrevet tidligere [20] og ble utpekt som kontroller.

Etikk uttalelse.

Denne studien ble godkjent av Institutional Review Board of Mayo Clinic og på grunn av arkiv naturen av prøvene, pasienten samtykke ble fraveket av styret.

RNA Utvinning og Microarray Hybridisering

fra den opprinnelige studien (n = 639 ), RNA var tilgjengelig for microarray fra 545 unike pasienter. Som tidligere beskrevet, etter histopatologiske ny vurdering av en ekspert urin patolog, ble svulst macrodissected fra omkringliggende stroma fra 3-4 10 mikrometer vevssnitt fra den primære Gleason grad av indeksen lesjon (den høyeste patologisk GS) for total RNA ekstraksjon [20 ]. Total RNA ble utsatt for forsterkning med WT-Ovation FFPE v2 kit sammen med Exon Module (Nugen, San Carlos, CA) i henhold til produsentens anbefalinger med mindre modifikasjoner. Amplifiserte produkter var fragmentert og merket med Encore Biotin Module (Nugen, San Carlos, CA) og hybridisert til humant Exon 1,0 ST GeneChips (Affymetrix, Santa Clara, CA) etter produsentens anbefalinger. Humant Exon GeneChips profil kodende og ikke-kodende regioner av transkriptomet under anvendelse av omtrent 1,4 millioner sonde seleksjons regioner (PSRs), heretter referert til som funksjoner.

Microarray Processing

Microarray kvalitetskontroll.

av de 545 pasientene med tilgjengelige vev og RNA, totalt 59 prøver mislyktes innledende QC (vurdert av Affymetrix Power Tools AUC metric [34]) og ble re-run. I tillegg ble en PC3 cellelinje (ATCC, Manassas, VA) kontrollforsøk med hver sats, og som brukes til å identifisere upålitelige funksjoner (se nedenfor). Menneske Exon array-data som tilsvarer denne studien er tilgjengelig fra National Center for Biotechnology Information Gene Expression Omnibus database (GSE46691).

Mikromatrise Normalisering, Fjerning av Upålitelige Funksjoner og Batch Effect Korreksjon

Feature sammendrag og normalisering av uttrykksverdier ble utført ved frosset robust multi rekke analyse (fRMA; [35]), som er tilgjengelig gjennom Bioconductor. En tilpasset sett av frosne vektorer ble samlet ved tilfeldig å velge 15 rekker fra hver av de 19 grupper på tvers av hele studien. Funksjoner forhørt med færre enn fire prober eller noen cross-hybridiserende prober (som definert av Affymetrix) ble fjernet (https://www.affymetrix.com). Variansen av funksjonsuttrykksverdier på de PC3-cellelinjer ble anvendt for å måle den tekniske versus biologisk variabilitet. Funksjoner med høyest 10% varians i PC3 cellelinjer ble fjernet fra uttrykket matrisen. Til slutt, for å evaluere og fjerne batch virkning, ble dataene dekomponeres i sine hovedkomponenter, og en analyse av varians-modellen ble anvendt. Som foreslått av en tidligere studie [36], ble de første 10 hovedkomponentene kontrollert for deres korrelasjon med batch virkning. Fra disse 10 hovedkomponenter (fange 31% av den totale variansen), ble de to komponentene som ble mest høyt korrelert med batch effekt fjernet.

Definisjon av Training and Validation Stiller, funksjonsvalg og Genomisk Klassifiserings Utvikling

Opplæring og valideringssett.

Etter å ha vurdert de molekylære forskjeller mellom de tre pasientgruppene ble det observert svært begrenset differensial uttrykk mellom NED og PSA-gjentakelse grupper. Differential uttrykk for individuelle egenskaper ble innhentet gjennom parvise sammenligninger av utfallet gruppene (Crisan et al., Manuskript under forberedelse). På en fold-endring terskel på 1,5 (etter korrigering for falsk-funn), bare to (av ~1.4 millioner) funksjoner ble funnet å være forskjellig uttrykt mellom Ned og PSA grupper, sammenlignet med 1186 og 887 i metastase utfall sammenlignet NED og BCR-bare grupper, henholdsvis [37]. Derfor, og for å utvikle en signatur som forutsier tidlig klinisk metastase, disse to gruppene ble kombinert i en enkelt kontrollgruppe. Tildelingen av pasienter til opplæring (n = 359) og validering (n = 186) ble definert i vår tidligere studie [20].

Feature utvalg.

Gitt det utgangspunktet stort antall funksjoner (~1.4 millioner), ble hver funksjon filtrert ved hjelp av en t-test (p 0,01) for kompleksitet reduksjon på treningssett (figur S1). Funksjoner ble ytterligere vetted i påfølgende utvalgs trinn. For å identifisere robuste funksjoner, ble ordnet logistisk regresjon anvendt [38], [39] med en elastisk netto straff på α = 0,5. Denne prosedyren ble bootstrapped 1000 ganger og det antall ganger en funksjon ble valgt av regularized regresjon ble telt. Funksjoner som ble valgt i det minste 25% av tiden ble anvendt for sorter utvikling.

Genomisk klassifisereren utvikling.

A tilfeldig skog maskinlæringsalgoritme ble brukt til å sette sammen de valgte funksjoner i en klassifikator [ ,,,0],40]. En endelig seleksjonstrinnet ble anvendt for å optimalisere funksjonen innstilt på klassifiseringsalgoritme. Bruke rfcv funksjon i randomForest pakken [41], den 10-fold kryssvalidering bety squared error (MSE) av modeller med synkende antall funksjoner ble plottet. I hver iterasjon, ble funksjoner ekskludert hvis de hadde den laveste 10% Gini-indeksen. Funksjoner som viste lite bidrag til resultatene av modellen ble ikke inkludert i den endelige klassifikator, holde disse funksjonene over kneet av MSE kurven (figur S2). Med denne siste funksjonene, den mtry og nodesize tilfeldige skog parametere ble innstilt med en nøyaktighet-optimalisere søk rutenett. Jakten på parameteren plass ble forfulgt med tune.randomForest funksjon i E1071 pakken [42]. Spesielt treningssettet (sammensatt av 359 prøver) ble videre delt inn i 1/3 trening og 2/3 testing og brukes med 1000 gjentakelser av bootstrapping for å bedre resultatanslag og kontroll over sittende. Den endelige genomisk klassifikator (GC) utganger en kontinuerlig variabel poengsum varierer mellom 0 og 1, hvor en høyere poengsum indikerer en høyere sannsynlighet for klinisk metastaser.

Klinisk klassifikator og integrert genomisk klinisk klassifikator.

å benchmark prognostisk evne til GC, har vi utviklet en klinisk-only «klassifikator (CC), trent på de samme pasientene som brukes til å oppdage GC. CC kombinerer patologiske GS, preoperativ PSA (pPSA), SM +, SVI, ECE og N + ved hjelp av logistisk regresjon. Ved å utføre pasienter, CC gir en score mellom 0 og 1, som er analog med GC. I tillegg, for å måle den felles prognostisk evnen av molekyl signatur og clinicopathologic variabler, ble en integrert genomisk-klinisk klassifikator (GCC) konstruert ved å kombinere de CC og GC modeller ved bruk av logistisk regresjon.

Sammenligning mot ytre Biomarker signaturer

Utførelsen av GC ble sammenlignet med tidligere publiserte gen signaturer [11] – [13], [15], [16], [18] – [24], [28] – [30 ] og individuelle genomiske markører assosiert med prostatakreft progresjon inkludert CHGA [43], DAB2IP [44], GOLPH2 [45], PAP [46], ETV1 og ERG [47], KI-67 [48], PSA [49], PSCA [50], PSMA [51], AMACR [52], GSTP1 [53], PCA3 [54], B7-H3 [55], TOP2A [14] og CAV1 [56]. Hver genomisk markør og genet i underskriftene ble tilordnet den tilhørende Affymetrix

kjerne

transkripsjon cluster (https://www.affymetrix.com/analysis/index.affx) der dette er tilgjengelig, ellers

utvidet

avskrift klyngen ble brukt. Basert på fRMA oppsummert uttrykk for de enkelte genene, ble underskriftene modellert i treningssettet ved hjelp av en tilfeldig skog og avstemt med

tune.randomForest

funksjon fra E1071 R pakken. Tuning på utføre en 20 med 20 rutenett søk for å finne den optimale «mtry» og «nodesize» modellparametere evaluert via 5-fold kryssvalidering for å maksimere nøyaktigheten.

Ytelse Vurdering av klassifikatorer og kliniske variabler

Statistiske analyser ble utført i R v2.14.1, og alle testene var tosidig med en 5% signifikansnivå. Den prognostiske evne alle klassifikasjonsapparater (GC, CC, GCC, og de eksterne biomarkør signaturer) ble sammenliknet med arealet under ROC-kurven (AUC), diskriminering boksplott og univariable (UVA) logistisk regresjon. Viktigheten av klassifikasjonsapparater forhold til klinisk informasjon og uavhengig prognostisk evne ble sammenliknet med multivariable (MVA) logistisk regresjon.

Kliniske variabler ble beregnet, kategorisert eller transformert som følger. GS ble dikotomisert i grupper med terskelen ≥8; Selv om konvensjon er å skille GS inn i tre grupper (≤6, 7, ≥8) den relative mangelen på pasienter med GS≤6 bedt dikotomisering av GS. Den pPSA, målt umiddelbart før RP, var log

2-transformert. Følgende variabler var binær: ECE, SVI, SM + og N +. Hormon og strålebehandling ble inkludert som egne binære kovariater hvis det gis i en adjuvant ( 90 dager etter RP) eller berging innstilling (etter PSA stigning). Behandlinger administreres påfølgende klinisk metastase ble ikke inkludert.

Basert på en flertallsstyre kriterium, pasienter med GC, CC og GCC skårer høyere enn 0,5 ble klassifisert som høy risiko, mens de med en score lavere enn eller lik 0,5 ble klassifisert som lav risiko. Kaplan Meier overlevelseskurver ble generert for prostatakreft spesifikk dødelighet (PCSM) og total overlevelse endepunkter. Til slutt ble alle oppfølgings ganger rapportert ved bruk av metoden beskrevet av Korn [57].

Resultater

Kliniske Kjennetegn på Studiepopulasjon

Fra studiepopulasjonen av 639 pasienter [20], 545 (85%), tilsvarende 192 tilfeller og 353 kontroller hadde tilgjengelig RNA og ble med hell hybridisert til mikromatriser for analyse (se metoder). Median alder for mennene i denne studien er 66 (IQR: 61-70) år, med en median på 16,9 år oppfølging. De kliniske kjennetegn ved disse pasientene er beskrevet i tabell 1. Totalt 60% av tilfellene (116/192) hadde GS ≥8 med bare seks GS ≤6, mens kontrollene var overveiende GS 7 (57%) og GS ≤6 (16 %). En tilsvarende andel av begge tilfeller og kontroller, (49% og 45%, henholdsvis) var patologisk stadium T3 /4. Kontrollene hadde 47% T2 sykdom (i motsetning til 27% av tilfellene), og 23% av tilfellene var N +, i motsetning til bare 8% for kontroller. En litt høyere hastighet av SM + ble observert i de tilfeller (54%) sammenlignet med kontroller (46%). Som forventet gitt studiedesign, median tid til BCR var svært lik mellom de tilfeller (2,3 år) og PSA kontroller (1,7 år). Mens det var 21 kliniske metastase hendelser blant kontrollene, disse skjedde med en median på 9,39 (IQR: 7.5-10.95) år, mens tilfeller opplevd mye raskere hendelser med en median på 5,47 (IQR: 3.7-8.14) år etter RP. Totalt var median tid til PCSM (n = 132) var 10,5 år. For å karakterisere den sanne biologiske potensialet i svulster fra pasienter som fremgang tidlig klinisk metastaser etter stigende PSA, utførte vi transkriptomet dekkende differensial uttrykk analyse for å teste hypotesen om at et uttrykk signatur i primærsvulster kunne bedre forutsi klinisk metastaser enn kliniske variabler alene .

utvikling av modeller for å forutsi tidlige kliniske metastaser

Vesker og kontroller ble sammenlignet og brukes for utvikling av en genomisk (GC), klinisk-only (CC) og integrert ( GCC) Klassifiserings modeller for å forutsi tilfeller (dvs. tidlig klinisk metastase etter stigende PSA) som det primære endepunktet (se metoder). De 545 prøvene ble tildelt opplæring (n = 359, 39% tilfeller) og validering (n = 186, 37% tilfeller) sett (figur 1). GC ble utviklet fra analyse av 1,1 millioner RNA funksjoner på microarray i treningen satt etter fjerning av kryss-hybridiserende og upålitelige funksjoner (se metoder). En innledende funksjonsvalg skritt basert på t-tester for kompleksitet reduksjon ga 18,902 forskjellig uttrykt funksjoner mellom saker og kontroller (Figur S1). Videre utvalg av disse forskjellig uttrykt funksjonene ved ordnet logistisk redusert listen til totalt 43. Som et siste steg, ble disse 43 forskjellig uttrykt funksjoner ytterligere filtrert til bare de som demonstrerte for å forbedre et tilfeldig skogbasert resultatberegningen (se metoder ). Dette resulterte i et endelig sett av 22 markører som tilsvarer RNA fra kodende og ikke-protein-kodende regioner av genomet (tabell 2). Flerdimensjonal skalering analyse viser gruppering av saker og kontroller basert på uttrykk for de 22 markører (figur 2). En tilfeldig skogmaskinlæringsalgoritme ble brukt til å generere GC score etter å ha samlet 22 markører med skog parametere for å optimalisere for høyeste nøyaktighet i treningssettet. Logistisk regresjon ble brukt til å sette sammen de seks clinicopathologic risikofaktorer i en CC og også integrert med GC å bygge en GCC.

Study Inndelingen i saker og kontroller. Opplæring og valideringssett vises.

Controls er angitt i blått og saker i rødt. I både trening og validering setter kontrollene har en tendens til å klynge på venstre side av tomten og sakene på høyre side av tomten. På denne måte er de fleste av de biologiske forskjeller uttrykt i den første dimensjonen av skalering. Random forest nærhet [https://www.stat.berkeley.edu/~breiman/] ble brukt til å måle 22 markør avstanden mellom prøvene.

Klassifiserings Performance i trening og validering Set

i treningssettet, ROC arealet under kurven (AUC) verdier for GC, CC og GCC var 0,90, 0,76 og 0,91 henholdsvis høyere enn noen individuell klinisk variabel (figur 3). I valideringssettet, GC og GCC hadde høyest AUC på 0,75, og 0,74, henholdsvis for å forutsi tilfeller. Den kliniske beskyttet CC hadde en AUC på 0,69, som bare var marginalt bedre enn patologiske GS alene (0,65). Formen på ROC-kurver for GC og GCC viser at disse modellene har høyest spesifisitet og sensitivitet sammenlignet med kliniske modeller over en terskel på -50% spesifisitet (fig S3). Diskriminering boksplott viser videre større median forskjeller i GC og GCC score mellom saker og kontroller enn for CC (figur 4).

For hver prediktor, AUC oppnådd i opplæringen og valideringssett, samt 95 % konfidensintervall for denne beregningen er vist. CC: klinisk-bare klassifikator. GC: genomisk klassifikator. GCC. Kombinert genomisk-klinisk klassifikator

Utdeling av poengsummene er plottet for A) CC B) GC og C) GCC for kontroller og saker. Median score og 95% konfidensintervall er representert ved en horisontal svart linje og hakk, henholdsvis. Ikke-overlappende hakk tyder på at forskjeller i fordelingen av skårer mellom saker og kontroller er statistisk signifikant. Slengere er representert som punkter utover boksplott værhår.

GC Omklassifisering av GS grupper

Fordelingen av saker og kontroller i valideringen satt av både GC og GS [58] risikogrupper er illustrert i figur 5 og oppsummert i tabell 3. blant GS ≤6 tumorer (n = 18) ingen hadde høye GC score, mens blant GS 7 tumorer (n = 97), nesten en tredjedel (29%) hadde høyt GC score og halvparten av disse var saker som utviklet seg tidlig metastase etter stigende PSA. Mens de fleste pasienter med høye GS (≥8) hadde høye GC score, blant de 29 (40%) med lave GC score var det bare syv tilfeller med 3 dødsfall fra prostatakreft. Totalt 116 av 186 (62%) validering sett pasienter hadde lave GC score hvorav bare 21 var tilfeller har resultert i 7 dødsfall fra prostatakreft. Blant de 70 (38%) pasienter med høyt GC score, var det 42 saker og 25 av disse mennene døde av prostatakreft.

GC score er plottet med en jitter slik å lettere skille pasientene blant hvert patologiske GS (x-aksen) grupper. Case-(rød) og kontroller pasienter (blå) er vist for hver kategori. Den stiplede svarte linjen indikerer GC cutoff på 0,5. Trender viser pasienter med høyt GC score tendens til å ha høye GS også.

GC er en uavhengig prognostisk variabel

For å teste for effekten størrelsen på individuelle variabler samt avhengigheter mellom disse variablene vi utført univariable og multivariable analyser ved hjelp av logistisk regresjon på valideringssettet (Tabell 4). I univariable analyse, fant vi GC, CC, GCC, GS, SVI og ECE å være statistisk signifikant prediktor for tilfeller (p 0,05). Den odds ratio for GC var 1,42 for hver 10% økning i GC poengsum. Når dikotomisert i lave og høye GC risikogruppene, som beskrevet ovenfor, odds ratio var 6,79 (95% KI: 3,46 til 13,29), mer enn det dobbelte av odds ratio på GS (OR: 3,02 (95% KI: 1,61 til 5,68) ) for å forutsi tilfeller. I multivariabel analyse, etter justering for post-RP behandlingen, forble GC den eneste signifikante variable prognostisk (p 0,001) med en OR på 1,36 for hver 10% økning i GC stillingen. Den uavhengige betydningen av GC tyder på at en mer direkte måling av tumorbiologi (dvs. 22-markør uttrykk signatur) tilføyer betydelig prognostisk informasjon om prediksjon av tidlig metastaser etter stigende PSA, som ikke fanges opp av de kliniske variabler tilgjengelig fra patologisk analyse.

saker med høy GC Scores dør tidligere fra prostatakreft og andre årsaker

neste sammenlignet overlevelse utfallet av saker og kontroller i Kaplan-Meier analyse av lave og høye GC poengsum grupper. Saker med lavere GC score hadde en median 6,9 år prostata-kreft spesifikk overlevelse sammenlignet med median 2,9 år for saker med høye GC score (p = 0,003) (figur 6). For total overlevelse, var det en signifikant (p = 0,03) forskjell i utfallet, med median total overlevelse etter metastasering av 2.5 og 4.98 år for saker med høy og lav GC score, henholdsvis. Blant alle kontroller, 21 pasienter utviklet klinisk metastaser utenfor de case-control definisjoner studie (dvs. 5 år etter stigende PSA). Vi vurdert om GC var i stand til å skille pasienter som hadde sent oppstår metastase hendelser blant PSA-kontroller (figur S4). GC var i stand til å signifikant (p 0,05) skille disse PSA-pasienter som ville gå på å oppleve senere klinisk metastase, fra de som ikke gjorde det. Denne forskjellen i resultater styrker oppfatningen videre at GC tiltak en komponent av det biologiske potensialet for metastasering, og at de pasientene med høyest GC score kan være mest utsatt for tidlig metastatisk progresjon post-RP.

Cases ble separert i høy ( 0,5) eller lav risiko i henhold til GC poengsum. Log-rank p-verdier vises i øverste høyre hjørne. Tid for å PCSM og OS måles fra BCR i år.

sammenligninger til Eksterne biomarkør Signatures

For å kunne sammenligne resultatene av GC til tidligere rapportert gen signaturer, vi samlet de genene forbundet til eksterne signaturer og kombinert dem i en tilfeldig Forest klassifikator (se metoder). I tillegg vurderte vi uttrykket av enkelte gener som tidligere er rapportert å være knyttet til prostata kreft utfall. Ytelsen til classifiers og de enkelte genene ble senere vurdert i både trening og valideringssett (figur 7 og S5). Som forventet, ser vi høye AUC i trening for nesten alle eksterne signaturer, tilsvarende det som ble observert med GC. Da gjaldt validering, AUC for hver modell redusert. Blant de 17 eksterne signaturer som ble modellert, 12 var statistisk signifikant prediktor for metastase (dvs. fikk sine 95% konfidensintervall ikke falle under en terskel tilfeldig sjanse AUC på 0,5) (figur 7). AUC for GC var 0,08 poeng høyere enn toppen utfører ekstern signatur, 16-genet signatur rapportert av Bibikova et al [12], som hadde en AUC på 0,68 (95% KI: 0,60 til 0,76,). I motsetning til uttrykk signaturmodeller, resultatene av de 16 enkeltgener testet var forventet å være lik i trening og valideringssett. Disse genomiske markører viser en samlet enighet i ytelse, med forskjeller i betydning trolig forklares med mindre utvalgsstørrelsen av validerings sett i forhold til treningssettet (figur S5). Av de 16 genomiske markører, bare B7-H3 (CD276), GSTP1 og PCA3 var statistisk signifikant i både trening og valideringssett (figur S5). Igjen, ingen av den enkelte genomiske markører utkonkurrere GC eller toppen utfører klinisk prediktor, GS (AUC ≤0.64).

For hver signatur, institusjonen knyttet til det, utgivelsesår, hovedforfatter, AUC oppnådd i trening og valideringssett, samt 95% konfidensintervall for denne beregningen er vist.

Diskusjoner

denne studien er designet for å teste hypotesen om at biologisk vurdering av både koding og ikke-kodende uttrykk profiler i primærsvulster kunne forutsi utviklingen av tidlig klinisk metastase følgende BCR. Vi oppdaget en 22-markør genomisk klassifikator (GC) som, uten offer følsomhet, var mer spesifikk i validerings enn etablerte prognostiske faktorer som GS. Basert på resultatene som er presentert her, måler GC en komponent av den biologiske potensialet for tidlig klinisk metastase bedre enn kliniske variabler eller som tidligere er rapportert biomarkør signaturer.

Legg att eit svar