Abstract
Genomisk teknologier inkludert mikromatriser og neste generasjons sekvensering har aktivert generasjon av molekylære signaturer av prostatakreft. Lister over differensielt uttrykte gener mellom maligne og ikke-maligne tilstander er tenkt å være fruktbare kilder til mulige prostata kreft biomarkører. Men slike lister av differensielt uttrykte gener kan være høyst variable for flere grunner. Som sådan har ser på dette uttrykket i sammenheng med gensettene og trasé vært mer robust. Ved hjelp av neste generasjons genomsekvense data fra Kreft Genome Atlas, differensial genuttrykk mellom alders- og scenografiske matchet menneskelige prostatakreft og ikke-maligne prøvene ble vurdert og brukt til å lage en sti underskrift av prostatakreft. Opp- og ned-regulerte gener ble tildelt veier består av kuraterte grupper av beslektede gener fra flere databaser. Betydningen av disse banene ble deretter vurdert i henhold til antall differensielt uttrykte gener som finnes i veien og deres posisjon i veien ved hjelp av Gene Set Enrichment Analyse og signalveien Impact Analysis. Den «transformerende vekstfaktor-beta signalering» og «Ran regulering av mitotiske spindel formasjons» trasé ble sterkt assosiert med prostatakreft. Flere andre vesentlige reaksjonsveier bekrefte rapporterte funn fra microarray data som antyder aktin cytoskjelettet regulering, cellesyklus, mitogen-aktivert proteinkinase signalisering, og kalsiumsignalering er også endret på prostatakreft. Dermed har vi demonstrert muligheten for pathway analyse og identifisert et underexplored område (Ran) for etterforskning i prostatakreft patogenesen
Citation. Myers JS, von Lersner AK, Robbins CJ Sang Q-XA (2015) forskjellig uttrykt gener og Signatur Pathways of human prostatakreft. PLoS ONE 10 (12): e0145322. doi: 10,1371 /journal.pone.0145322
Redaktør: Jian Cao, Stony Brook University, USA
mottatt: 14 oktober 2015; Godkjent: 02.12.2015; Publisert: 18.12.2015
Copyright: © 2015 Myers et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Data Tilgjengelighet: All relevant data er i avisen og dens saksdokumenter filer
Finansiering:. Dette arbeidet ble delvis støttet av Leslie N. Wilson-Delores Auzenne Graduate assistant for minoriteter tildelt JSM ved Florida State University Graduate School, Forsknings erfaring Program for kvinner i matematikk, naturfag og ingeniørutdanning av Florida State University til AKVL, og tilskudd fra Florida State University og et Velsignet Chair professorat i Cancer Research fra anonyme givere til QXAS. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Forkortelser : PSA, prostataspesifikt antigen; Degs, differensielt uttrykte gener; MAPK, mitogen aktivert proteinkinase; TGF-β, transformerende vekstfaktor-beta; TCGA, The Cancer Genome Atlas; FDR, falske funnrate; PANTHER, Protein analyse gjennom evolusjonære relasjoner; GO, Gene ontologi; GSEA, Gene Set Enrichment analyse; KEGG, Kyoto Encyclopedia of gener og genomer; SPIA, signalveien Impact Analysis; ES, berikelse poengsum; NES, normalisert berikelse poengsum; pNDE, sannsynligheten for overrepresentasjon; pPERT, sannsynligheten for forstyrrelse
Innledning
Prostatakreft er den nest mest diagnostisert kreft blant amerikanske menn, med over 220 000 nye tilfeller spådde i 2015 [1]. Prostataspesifikt antigen (PSA) har vært hjørnesteinen i prostata kreft screening i flere tiår. Men PSA er ikke en ideell biomarkør og utbredt bruk av PSA-screening er falt ut av tjeneste [2-4]. Reliance på PSA screening er problematisk fordi falske positive resultat av benign prostatahyperplasi eller prostatitt og fordi Ptil klarer å diskriminere lat sykdom, som fører til overdiagnostikk. Utvidelsen av genomisk og proteomikk teknologi og metodikk har forbedret karakterisering av tumorbiologi, kjøring jakten på mer nøyaktige kreft biomarkører. Gene og protein uttrykk forskjeller mellom normale og maligne prostatavevet er godt dokumentert og tjene som et basseng for mulige diagnostiske, prognostiske og Risikostratifisering biomarkører [5-24]. Genmutasjoner, epigenetiske forandringer, og mikroRNA uttrykk endringene som skjer i kreft initiering og progresjon har også blitt studert med mål om biomarkører [25-29]. Likevel er det fortsatt flere store hindringer i biomarkør gjennomføring. Lav reproduserbarhet over laboratorier, forskjeller i eksperimentelle plattformer og teknikker, den iboende heterogenitet av prostatakreft, og ubetydelig klinisk nytte eller små gevinster i sensitivitet og spesifisitet utover PSA vanskeliggjør identifisering, validering og implementering av biomarkører [30-35].
Tidligere arbeid har fokusert på valg og validering av enkeltgener som biomarkører. Men heterogenitet av prostatakreft gjør det svært lite sannsynlig å finne et enkelt gen som er en representant markør [36]. Screening paneler dannet ved kombinasjon av flere gener har blitt brukt for å øke prediktiv kraft for diagnose av kreft, gjentakelse, tilbakefall, og overlevelse utover bruk av PSA eller Gleason ballen alene [37-40]. Suksessen av biomarkør panel tilnærmingen er dokumentert av den kommersielle lanseringen av flere screeningtester som har funnet klinisk nytteverdi: ProMark [41], Oncotype DX [42], Prolaris [43], og tyde [44]. Disse panelene kan trekkes fra molekylære klassifikasjoner studier som bruker dette uttrykket til å lage en signatur for kreft.
Men molekylære klassifikasjoner og gen signaturer er ikke alltid stabil i den forstand at flere signaturer kan bli funnet for kreft. Store avvik mellom lister med forskjellig uttrykt gener (degs) fra microarray data har blitt fremhevet [45]. I noen tilfeller kan overlappingen mellom mikroarray datasett var så lav som 5% [46]. Så for hvert sett av degs, kan en annen signatur funnet. Dermed biomarkører valgt fra disse listene vil utføre med varierende grad av suksess. Tar listen over degs og samkjøre dem til en prognostisk markør kan generere en mer nyttig antatt biomarkør bassenget fordi da bare gener korrelerte med prognosen vil omfatte den molekylære signatur. Men Ein-Dor
et al
. viste at i brystkreft, var det ingen enkelt, unikt sett av gener som forutsagt overlevelse fordi endring av pasientpopulasjonen kunne produsere flere sett av gener som er av lik prognostisk evne til å forutsi overlevelse [33]. Videre korrelasjon med overlevelse var ikke nødvendig for prognostisk evne til [33]. Slik at det er sannsynlig at mange paneler utelukke en rekke andre gener som kan være potensielle biomarkører fordi panelet var avledet fra ett legeme av prøver (selv om det kan være stor) og betraktet bare sterkeste korrelasjon.
En alternativ tilnærming er veien basert analyse. I pathway analyse, er en samling av beslektede gener fra samme sti eller nettverk av interaksjon vurderes i stedet for å undersøke en gruppe av potensielt urelaterte gener som optimaliserer følsomhet og selektivitet av diagnose eller prognose. Det er økt overlapping mellom data på veien nivå sammenlignet med overlapping mellom lister av degs [46, 47]. Pathway analyse ikke forsømme den samarbeidende natur gener og anser at oftentimes gener som er involvert i den samme prosessen er ofte deregulert sammen. Ved å se på veien, små variasjoner i instrumentering eller metode er mindre sannsynlig å påvirke resultatene, som fører til mer konsistente resultater på tvers av ulike sett av data [48]. Dermed veien tilnærmingen gir mer robuste resultater, forbedrer sykdom klassifisering, og kan avsløre nye innsikter om en sykdom [49-51]. En type av bane analyse starter med et differensielt uttrykt gen og korrelerer ekspresjon av gener som er involvert i den samme bane eller lignende prosess med en bestemt diagnostisk eller prognostisk utfall [52-54]. En lignende iterasjon starter med en sti av kjent betydning i kreft initiering eller progresjon og evaluerer den prognostiske kraft av sine individuelle komponenter. Dette er gjort for den mitogen-aktivert protein kinase (MAPK) bane [55], Akt [56], mTOR vei [57, 58], Toll-like receptor signalveien [59], og andre onkogene signaturer [60].
i denne utredningen, omfattende genuttrykk i human prostatakreft ble karakterisert ved hjelp av en upartisk sti tilnærming. Neste generasjon sekvensering ble benyttet en profil av forskjellene i RNA-ekspresjon mellom humane tumorer og ikke-ondartet vev fra pasienter å skaffe. Pathway analyse inkludert Gene Set Enrichment Analyse og signalveien Impact Analysis. To veier var signifikant assosiert med menneskelig prostata tumors- «Ran regulering av mitotisk spindel formasjon» bane og «transformere vekstfaktor-beta (TGF-β) signaliserer» bane.
Materialer og metoder
RNA sekvense data
nivå 3 avidentifiserte data for prostatakreftprøver og alle tilgjengelige ikke-maligne prøver fra disse prostatakreftpasienter ble lastet ned fra kreft~~POS=TRUNC Genome Atlas (TCGA) data portal (https: //tcga- data.nci.nih.gov). Nivå 3 beskriver data som har blitt behandlet og aggregeres til genekspresjon signaler for en prøve. For hver prøve, inneholder data uttrykket teller opp til 20 531 koding og ikke-kodende RNA-transkripsjoner pluss klinisk informasjon som alder, stadium, Gleason score, PSA nivå, og rase /etnisitet. Før analyse, tumor og ikke-maligne prøver ble tilfeldig trukket til å oppnå en alders- og scene-matchet pool av 225 prøver (S1 Table). Totalt 173 prostatakreft prøver og 52 ikke-maligne prøver fra 204 unike pasienter ble analysert. Pasienten klinisk informasjon er presentert i tabell 1.
Differensial Gene Expression
R programmeringsmiljø (versjon 3.1.2) [61] ble brukt til å behandle rådata, utføre statistisk beregninger, og utføre differensialuttrykk analyse. Etter alders- og scene-matching, ble 393 transkripsjoner fjernet fordi de manglet uttrykk i de 225 prøvene som inngår i datasettet. RNA teller for de resterende 20,138 transkripsjoner ble avrundet til nærmeste hele tall og sammenstilles i en matrise for å bygge datasettet. Størrelsen av ekspresjon endres i forhold til ikke-maligne prøver ble også beregnet ved å ta basen to logaritmen av tumor /ikke-ondartet midlere uttrykk forhold. For gener uten ekspresjon i enten tumor eller ikke-maligne prøver, log
2 gangers endringer ble justert ved tilsetning av en til hver bety og deretter å beregne forholdet. Alle logg
2 verdier er oppgitt verdier etter slike justeringer. Negative fold endringer indikert nedregulering i tumorprøver mens positive verdier angitt oppregulering. R pakke DESeq2 (versjon 1.6.3) [62] ble brukt til å identifisere degs i TCGA pasient RNA-data. Databehandling ble gjort på Florida State University High Performance Computing Cluster. DESeq2 returnerte P-verdi bestemmes av Wald statistikk og en justert P-verdi (Q-verdi) for å korrigere for multiple sammenligninger testing med Benjamini-Hochberg metode for å bestemme den falske funnraten (FDR). Degs ble definert som gener forskjellige med en FDR mindre enn 1% (Q 0,01).
For å vurdere betydningen av de identifiserte degs, ble det gjennomført analyser for å søke etter overrepresentert veier, gen sett berikelse, og varslere pathway effekt. Først ble overrepresentert elementer identifisert blant de degs. Protein analyse gjennom evolusjonære relasjonene (PANTHER) klassifikasjonssystemet og analyseverktøy ble brukt til å kategorisere degs av PANTHER protein klasse, Gene ontologi (GO) Molecular funksjon, og GO biologisk prosess for å deretter finne ut om noen av disse klassene eller gå vilkårene var overrepresentert [ ,,,0],63]. PANTHER overrepresentasjon Test (release 20150430) ble brukt til å søke i data mot PANTHER database (PANTHER versjon 10.0 Utgitt 2015-05-15) og GO database (Utgitt 2015-05-09) for å identifisere enten protein klasser eller gå kommentarer overrepresentert i våre data i forhold til en referanse humane genom. P-verdier ble justert ved hjelp av en Bonferroni korreksjon.
Pathway Analysis
Gene Set Enrichment Analysis (GSEA) [64] ble brukt til å identifisere grupper av gener beriket i enten svulst eller ikke-ondartet betingelse. Den GSEA analyseverktøyet (versjon 2.2.0) ble lastet ned fra Broad Institute nettsted (https://www.broadinstitute.org/gsea/index.jsp). Kuratert genet sett av BioCarta og Reactome trasé ble lastet ned fra Broad Institute Molecular Signaturer Database. En ekstra gen sett ble konstruert fra Kyoto Encyclopedia of gener og genomer (KEGG) trasé [65]. Pathways med minst relevans for prostatakreft ble ekskludert. De KEGG trasé inngår i analysen er oppført i saksdokumenter (S2 tabell). Hele RNA-ekspresjon telle matrise ble lastet inn i GSEA applikasjonen uten å begrense inngangen til kun degs. Både små (mindre enn 5 gener) og store ( 500 gener) gensettene ekskludert fra analysen
signalveien Impact Analysis (SPIA) ble brukt for å vurdere betydningen av anrikede veier når det gjelder deres. innflytelse og evne til å aktivere eller hemme en vei [66]. SPIA analyse ble utført ved hjelp av R-pakken «SPIA» (versjon 2.18.0) [67]. Entrez IDer, logg
2 fold endringer, og Q-verdier for alle genene ble utarbeidet. Den differensielle ekspresjonen cut-off anvendt i SPIA algoritmen var basert på den FDR-justerte Q-verdi. Analysen ble kjørt med samme skreddersydd liste over veier som brukes i GSEA (S2 Table) og oppdaterte versjoner av disse banene var nedlasting før du kjører analysen (åpnes 7/29/2015).
Resultater
Ved hjelp av en 1% FDR (Q 0,01), DESeq2 analyse merket 11,115 gener og karakterutskrifter som statistisk forskjellig mellom tumorprøver og ikke-maligne prøver i vår TCGA datasett (S3 og S4 tabeller). Dette dekker 55% av genene og transkripsjoner sekvensert. Antallet nedregulert gener og transkripsjoner utgjorde 5379 og antallet oppregulert gener og transkripsjoner utgjorde 5736. Samlet de største endringene som er observert var i nedregulering av gener og transkripsjoner (fig 1). Størrelsen av den opp-regulering av gener og transkripter var mindre enn størrelsen av nedregulert gener og omfanget av uttrykket var også mindre. De tyve mest ned-regulert og tyve mest up-regulerte gener som er presentert i Tabell 2 og Tabell 3.
I dette endimensjonal spredningsdiagram av størrelsen av genekspresjon endringer representert ved log
2 gangers forhold vises. Hvert punkt representerer et gen eller karakterutskrift. Betydelig forskjellig uttrykt gener og transkripsjoner er vist som solide røde diamanter.
Klassifisering og overrepresentasjon analyse
11,115 degs ble gruppert etter PANTHER protein klassen, GO molekylær Funksjon og GO biologisk prosess merknader. Totalt 6,254 degs hadde enten PANTHER protein klassen, GO biologisk prosess, eller gå Molecular Funksjon merknader og ble videre klassifisert. Gruppering av protein klasse og GO biologisk prosess kategorier viste seg å være den mest informative (figur 2). Den komplette klassifikasjoner kan bli funnet i saksdokumenter (S5 tabell). De degs representerer et bredt spekter av protein klasser som er involvert i et bredt spekter av prosesser. Den «Nucleic Acid Binding» PANTHER protein klassen omfatter både RNA og DNA-bindende proteiner, nukleaser, og heli. Den «Transkripsjon Factor» protein klassen er sub-kategorisert av strukturelle motiv og inneholder også kofaktorer og atomhormonreseptorer. Proteaser og fosfataser er funnet i «hydrolase» proteinklassen. De typer av «reseptor» som er inkludert er protein kinase-reseptorer, nukleære hormonreseptorer, cytokinreseptorer, ligand-gated ionekanaler, og G-protein koblede reseptorer. Kategorien «Enzyme Modulator» har G-protein, kinase, fosfatase, og protease modulatorer. Interessant kategoriene var generelt ikke hovedsakelig befolket av nedregulert eller oppregulert gener eller transkripsjoner. For alle protein klasser unntatt «Nucleic Acid Binding» klassen, ble degs jevnt fordelt over svulsten og ikke-maligne prøver. I «Nucleic Acid Binding» protein klassen, det var nesten en og en halv ganger så mange oppregulert gener som nedregulert. Overflod av nukleinsyre bindende gener foreslår endret transkripsjonen aktivitet i tumorprøver.
(A) «Nucleic Acid Binding» inneholder RNA og DNA bindende, nukleaser, og heli. «Transkripsjon Factor» omfatter sink finger, helix-turn-helix, høy mobilitet gruppeboksen, grunnleggende helix-loop-helix, og grunnleggende leucine glidelås transkripsjonsfaktorer; kofaktorer; og atomhormonreseptorer. «Hydrolase» refererer til proteaser, fosfataser, esteraser, lipaser, deaminaser, fosfodiesterase, glycosidases, deacetylases, pyrophosphatases, glukosidaser, galaktosidaser og amylaser. «Receptor» omfatter protein-kinase-reseptorer, nukleære hormonreseptorer, cytokinreseptorer, ligand-gated ionekanaler, og G-protein koblede reseptorer. «Enzyme Modulator» omfatter G protein, kinase, fosfatase, og protease modulatorer. (B) «Metabolic Process» inneholder karbohydrat, cellulær aminosyre, lipider, proteiner, og nukleobase-inneholdende forbindelse metabolisme; og den trikarboksylsyre syklus. «Cellular Process» kategoriene er celle-celle signalisering, cellesyklus, vekst og spredning, cellekomponent bevegelse, og cytokinese. «Biological Regulation» omfatter regulering av apoptose, metabolisme, cellesyklus, translasjon, katalytisk aktivitet, og homeostase. «Utviklingsprosess» kategorier er system, ektoderm, mesoderm og endoderm utvikling; celledifferensiering; død; anatomisk struktur morphogenesis; embryo utvikling; kjønnsbestemmelse; og mønster spesifikasjon prosesser. «Lokalisering» inkluderer transportproteiner, protein og RNA lokaliseringsprosesser.
De to mest tallrike GO biologisk prosess grupper-«Metabolsk Process» og «Cellular Process» -Er ikke overraskende, fordi disse inneholder gener som er involvert i de mest grunnleggende av livsprosesser. Faktisk har metabolske forandringer blitt mye dokumentert i tumorer [68-70]. De økte energiske og biosyntetiske behov prolifererende kreftceller blir ofte møtt gjennom metabolske feilregulering [71-73]. Overskriften «Metabolic Process» omfatter karbohydratmetabolisme, cellulær aminosyre metabolisme, lipid- metabolisme, nukleobase-inneholdende forbindelsen metabolisme, proteinmetabolisme, og den trikarboksylsyre syklus. «Cellular Process» innbefatter celle-cellesignalering, cellesyklus, vekst og proliferasjon, cellekomponent bevegelse, og cytokinese. «Biological Regulation» omfatter regulering av apoptose, metabolisme, cellesyklus, translasjon, katalytisk aktivitet, og homeostase. Kategorien «Developmental Process» inneholder system, ektoderm, mesoderm og endoderm utvikling, samt celledifferensiering, død, anatomisk struktur morphogenesis, embryo utvikling, kjønnsbestemmelse, og mønsteret spesifikasjon prosesser. «Lokalisering» refererer til generelle transportproteiner og spesifikke proteiner og RNA lokalisering prosesser.
PANTHER overrepresentasjon statistikken ble brukt til å beregne sannsynligheten for at de tett befolkede protein klasser og GÅ grupperinger blant de degs ville oppstå ved tilfeldig sjanse. Faktisk, mange av de mest tallrike kategoriene er overrepresentert i datasammenlignet med et referansegenom (tabell 4). De tre mest tallrike protein klasser-«Nucleic Acid Binding», «Transkripsjon Factor», og «hydrolase»-var beriket sammen med klassene «Transferase» og «Transporter». De fem mest befolkede GO biologiske prosesser ble også beriket: «Metabolsk Process», «Cellular Process», «Biologisk Regulation», «Lokalisering» og «Developmental Process». Den «Flercellede Organism Process», «Biologisk Grep», «Cellular Component organisasjon eller Biogenesis», og «Immune System Process» GO biologiske prosesser ble også beriket. Til slutt, fem av de seks beste GO Molekylære funksjoner ble beriket: «Binding», «katalytisk aktivitet», «Nucleic Acid Binding transkripsjonsfaktor aktivitet», «Transporter Aktivitet», og «Structural Molecule Activity»
Gene Set Enrichment analyse
en begrensning av en klasse eller sti overrepresentasjon analyse er at den ikke angir hvilken tilstand er forbundet med overrepresentasjon; GSEA gjør. Uttrykte gener ble rangert etter sin sammenheng med den ondartede fenotype og deretter denne listen ble sammenlignet sett av gener i en sti, linking vei berikelse til en fenotype. De mer høyt korrelerte gener i et gen sett, jo høyere er betydningen av dette gen settet. De gensettene med høyest normalisert berikelse score er presentert i tabell 5 og andre resultater er oppført i saksdokumenter (S7 tabell). FDR cutoff ble satt til 25% for å maksimere hypotese generasjon. Bare en sti ble anriket i tumorprøver, det «RanMS bane», som omfatter gener som regulerer dannelsen av den mitotiske spindel under celledeling. Ti gener i vår liste over degs tilhørte denne veien, som hver bidrar til sin anrikning i maligne fenotype (tabell 6). Alle ti ble uttrykt forskjellig og oppregulert i de ondartede prøvene. De resterende baner ble anriket i den ikke-ondartet fenotype. Den mest betydningsfulle pathway anriket i den ikke-maligne fenotype var «kalsiumsignalering» -veien. Berikelse av kalsium signalveien skyldtes 81 degs og 19 andre gener eller transkripsjoner (S8 Table). Også anriket i den ikke-maligne fenotype var flere andre signalveier (oxytocin, prolaktin, cAMP, MAPK, cGMP-PKG, TGF-β bear, og Ras) og veier relatert til celle-celle og celle-matrise-adhesjon (ekstracellulære matriks reseptor interaksjon, aktin cytoskjelettet regulering, proteoglykaner og fokus heft).
signalveien Impact Analysis
SPIA vurderer hvorvidt de degs funnet i en bane har en meningsfull effekt innenfor den veien, og dermed løser topologien degs i trasé [66]. Med andre ord, er pathway betydning delvis avhengig av om antallet degs observert i en bane er større enn det som observeres ved tilfeldige. Dette er fanget i sannsynligheten for representasjonen. Pathway betydning er også delvis basert på om degs i en bestemt bane er på avgjørende veikryss og kan dermed forstyrre veien. Dette er sannsynligheten for forstyrrelse. Disse to sannsynlighetene er kombinert i en global sannsynlighet som er justert etter den falske funnrate. Dette justerte beregningen ble brukt til å rangere effekten av trasé. Mange av de samme trasé ble identifisert som signifikant i begge GSEA og SPIA analyse (tabell 7). Faktisk, de 8 mest signifikante pathway resultater fra SPIA ble alle betydelig anriket på GSEA. Men bare «kalsium signalisering» veien ble høyt rangert i begge analysene. Den eneste vei aktiveres i ondartet tilstand var «TGF-β signale» bane (tabell 8). De andre banene ble alle inhibert i den ondartede tilstand. I likhet med GSEA resultater, flere signalveier (oxytocin, cAMP, MAPK, cGMP-PKG, TGF-β, Hippo, Rap1, ErbB, og Ras) og veier relatert til celle-celle og celle-matrix adhesjon (proteoglykaner, fokal vedheft, og aktin cytoskjelettet forskrift) ble påvirket. uthevet kan nås bilder av trasé med degs i saksdokumenter (S9 tabell).
Diskusjoner
Globale uttrykk studier har dokumentert mange forskjellig uttrykt gener i menneske prostata kreft [7, 9, 13-15, 96-102]. Lucas og Heath samlet en liste over differensielt uttrykte gener med rapportert prognostisk betydning i prostata kreft [30]. Av de 22 genene er oppført, ble 19 forskjellig uttrykt i vår TCGA datasettet, og det var enighet i uttrykk mønster mellom 12 gener.
PTEN
,
TMPRSS2
,
MYC
,
SMAD4
,
EZH2
,
p53
,
BCL2
,
NPY
,
PLA2G7
,
Ki-67
,
p16
, og
BAX
uttrykk i våre funn matchet det som ble presentert i litteraturen.
PTEN
, en tumor suppressor, ble nedregulert i maligne prøver. Slettingen av
PTEN
korrelerer med høyere Gleason grad, risiko for progresjon, og tilbakefall etter behandling, og avanserte lokalisert eller metastatisk sykdom og død [103, 104].
SMAD
4 ble nedregulert i våre TCGA prostatakreft data og har også blitt funnet å være nedregulert i prostatakreft, inkludert avanserte svulster [105, 106]. Den delesjon av dette genet har ført til invasive, metastatisk, og dødelige prostatakreft i en musemodell [39].
TMPRSS2
var oppregulert, og dette er i samsvar med rapporter om det blir mer høyt uttrykt i prostata carcinom i forhold til normal prostata epitel [107, 108].
TMPRSS2
bidrar til invasjonen og metastasering av prostata kreft [109]. Videre
TMPRSS2-ERG
genet fusjon holder løftet som en potensiell prostatakreft biomarkør [110].
MYC
ble også oppregulert i dette datasettet og overekspresjon (genamplifisering, mRNA og protein økning) av
MYC
i prostata kreft er veldokumentert [111-115].
MYC
genamplifisering ble oftere funnet i metastaser [116, 117] og også korrelert med dårlige prognostiske faktorer som høyere Gleason og histopatologiske scorer [118], eller større sjanse for PSA tilbakefall [114].
EZH2
oppregulering rapporteres her og i litteraturen der slike overekspresjon ført til økt spredning i prostataceller og er assosiert med aggressiv sykdom og økt risiko for tilbakefall [119]. Uttrykket av
p53
mRNA ble økt i maligne prøver i våre TCGA data. I en studie av prostatakreftpasienter,
p53
positivt uttrykk ble sett i de fleste (69,1%) av pasientene med antall positive pasienter øker som scene og Gleason score økt. P53 var også en uavhengig prediktor for tilbakefall [120].
BCL2
mRNA uttrykk ble redusert i TCGA tumorprøver. Fraværet av BCL-2-protein ekspresjon er rapportert i prostatakreft [120, 121]. Videre er BCL-2 ekspresjon negativ i androgen-avhengige, men øket i hormon ufølsomme prostatakreft [122-124] og korreleres med dårlig prognose [125]. Pro-nevropeptid Y er oppregulert i denne studien og i litteraturen [126, 127]. Pro-nevropeptid Y oppregulering er assosiert med ikke-aggressive svulster [128] og regulerer spredning i prostata kreft cellelinjer [129].
PLA2G7
var oppregulert i våre data. Det er rapportert å være mer sterkt uttrykt i prostatakreft sammenlignet med godartede prøver [130, 131] og TCGA prøvene studert her. Nivåer av
Ki-67
mRNA ble økt i tumor versus ikke-maligne prøver fra våre TCGA data og i litteraturen i forhold til normalt vev [132]. Videre Ki-67 protein økes i prostatakreft [133-136], prostata kreft metastaser [137, 138] og er et nyttig prognostisk markør [139]. I vår liste over degs,
p16
ble oppregulert. Nylig ble p16-ekspresjon funnet i et stort flertall av prostatavevet [140].
BAX
mRNA uttrykk ble økt i denne TCGA datasettet og BAX protein hadde økt uttrykk i prostatakreft [141].
De resterende 7 degs felles med Lucas og Heath liste vises et avvik i uttrykk mønster mellom våre resultater og annen relevant litteratur.
TGF-β1
ble ikke uttrykt forskjellig, men
TGF-β2
ble nedregulert. Uttrykk for
TGF-β1 Hotell og
TGF-β2
ble økt i prostatakreft sammenlignet med normale eller ikke-ondartet vev [142-147]. Men
TGF-β3
ble nedregulert i samråd med andre rapporter om
TGF-β3
uttrykk i prostata kreft [97, 148]. Både α og p isoformer av
IL-1 Hotell og
IL-6
ble nedregulert i denne TCGA datasett.
IL-1α Hotell og
IL-6
ble oppregulert i prostatakreftprøver [149-153].
IL-6
stimulert veksten av LNCaP celler [154] og forhøyet
IL-6
ble også assosiert med dårlig prognose i prostata cancer [149, 155-162].
IL-1β
har blitt rapportert både opp- og ned-regulert i litteraturen. Proteinekspresjon i pasientprøvene ble nedregulert [163], men forhøyet gen og protein ekspresjon i humane kreftceller og tumorer har også blitt rapportert [164]. I vår liste over degs,
p21
ble nedregulert. Aaltomaa
et al
. rapporterte p21 protein ekspresjon i de fleste av prostatakreft, men ikke i normale prostata epitelceller [165], men andre studier har rapportert p21 immunofarging i bare 20% -35% av kreftprøvene [166, 167]. Begge
p21 Hotell og
p16
hemmet vekst i prostata kreft cellelinjer [168]. Vaskulær endotelial vekstfaktor A (
VEGF-A
) ble nedregulert i våre data. Høy uttrykk for
VEGF
korrelert med dårlig prognose [169], men noen studier rapportert at høyere uttrykk av
VEGF-A
korrelert med bedre klinisk resultat [170].
TRAIL /TNFSF10
ble oppregulert i våre TCGA data. Mens epitel uttrykk for TRAIL protein var sterkere i tumorer, ble stromal uttrykk for TRAIL redusert eller fraværende i tumorer [171, 172]. Bare stromal TRAIL uttrykk korrelert med tilbakefall overlevelse [171].
NFKB1
ble nedregulert i våre data. Men
NFKB1
protein uttrykk gradvis økt i normale, benign prostatahyperplasi og prostata kreft vev [173]. De andre degs med prognostisk betydning i prostata kreft som ikke var forskjellig uttrykt i vår liste over degs inkluderer
IL-7
,
CCL-2
, og
CDH1
.
Sammenligninger mellom degs presentert her og degs nevnt i andre studier høydepunkt avvik fra eksperiment for å eksperimentere.