PLoS ONE: Vanlige menneskelige kreftgener oppdaget av Integrert Gene-Expression Analysis

Abstract

Bakgrunn

Microarray teknologi muliggjør en standardisert, objektiv vurdering av onkologisk diagnose og prognose. Imidlertid er slike undersøkelser er typisk spesifikke for visse krefttyper, og resultatene har begrenset bruk på grunn av utilstrekkelig validering i store pasientkullene. Funn av gener som vanligvis regulert i kreft kan ha en viktig implikasjon i forståelsen av felles molekylære mekanismen for kreft.

Metoder og funn

Vi er beskrevet en integrert gen-uttrykk analyse av 2.186 prøver fra 39 studier for å identifisere og validere en krefttype-genet uavhengig signatur som kan identifisere kreftpasienter for et bredt spekter av humane maligniteter. Den common av genuttrykk i 20 typer felles kreft ble undersøkt i 20 trening datasett. Den diskriminerende effekt av en signatur er definert av disse vanlige kreftgener ble evaluert i de andre 19 uavhengige datasett inkludert nye krefttyper. QRT-PCR og vev microarray ble brukt til å validere ofte regulert gener i flere krefttyper. Vi identifiserte 187 gener feilregulert i nesten alle kreft vevsprøver. Den 187-genet signatur kan robust forutsi kreft sammenlignet med normal status for et bredt spekter av humane maligniteter med en total nøyaktighet på 92,6%. Vi videreutviklet vår signatur til 28 gener bekreftet av QRT-PCR. Den raffinerte signaturen fortsatt oppnådde 80% nøyaktighet klassifisere prøvene fra blandede krefttyper. Denne signaturen gir gode resultater i prediksjon av nye krefttyper som ikke var representert i trening datasett. Vi har også identifisert tre biologiske pathways inkludert glykolyse, cellesyklus sjekkpunkt II og plk3 trasé hvor de fleste genene er systematisk oppregulert i mange typer kreft.

Konklusjoner

identifisert signaturen har fanget avgjørende transkripsjons funksjoner i neoplastisk transformasjon og progresjon generelt. Disse funnene vil bidra til å belyse felles molekylære mekanismen for kreft, og gi ny innsikt i kreftdiagnostikk, prognostics og terapi

Citation. Lu Y, Yi Y, Liu P, Wen W, James M, Wang D , et al. (2007) Felles menneskelige kreftgener oppdaget av Integrert Gene-Expression Analysis. PLoS ONE 2 (11): E1149. doi: 10,1371 /journal.pone.0001149

Academic Redaktør: Oliver Hofmann, South African National Bioinformatikk Institute, Sør-Afrika

mottatt: 13 august 2007; Godkjent: 16 oktober 2007; Publisert: 07.11.2007

Copyright: © 2007 Lu et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av NIH gi R01CA58554 (MY)

konkurrerende interesser:.. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Kreft er en av de viktigste årsakene til død i vestlige land som resulterer i en av fire dødsfall. Mer enn 100 typer kreft med forskjellig forekomst har blitt diagnostisert i ulike organer eller vev. Kreft er tilknyttet flere genetiske og regulatoriske aberrasjoner i cellen. For å fange opp disse avvikene, DNA-mikromatriser, som tillater samtidig måling av uttrykket nivåer av titusener av gener, har blitt stadig mer brukt for å karakterisere de globale gen-uttrykk profiler av tumorceller og matchet normale celler av samme opprinnelse. I løpet av de siste årene har den globale gen-uttrykk profiler av ulike kreftformer er analysert og mange gen-uttrykk signaturer som er forbundet med kreft progresjon, prognose og respons på behandling har blitt beskrevet [1] – [19]. Imidlertid er slike undersøkelser er typisk spesifikke for visse tumorer. Krefttypespesifikke signaturer fra disse studiene viser liten overlapp i genet forfatninger og biologisk viktige veier. Tiår med forskning innen molekylær onkologi har gitt noen nyttige tumor-spesifikke molekylære markører, på grunn av begrensninger med sample tilgjengelighet, identifisering, anskaffelse, integritet, og forberedelse [20]. Kreft er en svært heterogen sykdom, både morfologisk og genetisk. Det er fortsatt en utfordring å fange en viktig felles transcriptional trekk ved neoplastisk transformasjon og progresjon.

Å trekke ut maksimal verdi fra den siste akkumulering av offentlig tilgjengelige kreft gen-uttrykk data, er det nødvendig å vurdere, integrere og inter -validate flere datasett. Omfattende analyser av en myriade av publiserte datasett gjør det mulig å finne felles kreftgener og essensielle funksjonelle konsekvenser som er forbundet med startfasen og progresjon generelt. Systematisk karakterisering av uttrykk endringer i biologiske reaksjonsveier mellom ulike typer av kreft vil til slutt føre til en bedre forståelse av hvilke forstyrrelser i cellen gir opphav til kreft. Disse funnene vil gi flere kliniske retninger for kreftdiagnostikk, prognostics og terapi på grunnlag av genekspresjon signatur av pasientene. I denne studien har vi beskrevet en integrert gen-uttrykk analyse av 2.186 prøver fra 39 ulike studier for å identifisere og validere en kreft genet signatur som er uavhengig av tumortyper og kan identifisere kreftpasienter for et bredt spekter av menneskelige maligniteter.

Resultater

Common genuttrykk endringer i ulike krefttyper

Vi først analysert genuttrykk profiler av 1,223 humane prøver (343 normalt vev og 880 tumorvev) fra trenings datasett 1-20 inneholdende 20 forskjellige typer kreft (Tabell S1). Den common av genuttrykk i disse 20 krefttyper ble statistisk vurdert ved permutasjon analyser (p 10

-5). I alt ble 187 gener som vanligvis er berørt i kreft identifisert. Av disse 117 var oppregulert og 70 ble nedregulert i nesten alle kreft vevsprøver, uavhengig av deres vev opprinnelsesland (tabell 1 og 2). Med bioinformatikk verktøy, FatiGO (https://fatigo.bioinfo.cnio.es), fant vi 142 av 187 kreftgener var signifikant assosiert med minst én Gene Ontologi kategori (GO). Flere funksjonelle kategorier har vist seg å være viktig for kreftutvikling og kreft progresjon (tabell S2). For eksempel, 11 gener (BFAR, CARD4, SPP1, SNCA, BAX, STAT1, Clu, GULP1, BID, CIDEA og PPP2R1B) kontroll programmert celledød; 8 gener (TTK, Reck, BAX, STAT1, NME1, CCNB2, E2F3 og PPP2R1B) er involvert i regulering av cellesyklus; 8 gener (TAP1, APOL2, SPP1, Clu, PSMB8, TAPBP, HLA-F og TNFSF13b) spiller roller i immunresponsen; og 6 gener (TTK, SPP1, NME1, NAP1L1, NPM1 og TNFSF13b) regulerer celleproliferasjon. I tillegg gener som er involvert i protein transport, M fase cellesyklus, sekretoriske vei og DNA reparasjon er konsekvent oppregulert i et stort flertall av krefttyper.

Validering av felles kreft gener ved QRT-PCR og TMA

for å validere microarray gene expression resultatene fra den integrerte gen-uttrykk analyse, de relative uttrykk nivåer av 32 av de 187 kreftgener ble bestemt ved QRT-PCR analyse ved hjelp av helt uavhengige utvalg fra tre hver av bryst, lunge, prostata, tykktarm og livmorhalskreft og deres matchet normalt vev. Vi bekreftet uttrykket resultater for de fleste av disse utvalgte gener (endring 1,5, p≤0.05 og konsistens 60%) (tabell 3). De 10 gener med absolutte ganger endring 4, p≤0.05 og konsistens 85% ble ytterligere bekreftet ved hjelp av en annen 18 matchet tumor og normale prøver fra bryst, lunge og livmorhalskreftpasienter. I det viste analysen uttrykket nivåer av disse 10 gener var fremdeles signifikant forskjellige med absolutt ganger endring 4, p≤0.05 og konsistens 85%, med unntak av gener SPP1 og NDRG2, som oppviste litt redusert konsistens (figur 1).

Brett forskjeller enn matchede normale kontroller ble plottet for 21 til 24 svulster fra alle testede vev inkludert bryst, lunge, prostata, colorectal og cervical svulster i to eksemplarer, noe som gir 42 til 48 datapunkter per genet. Den gjennomsnittlige ganger endring, p-verdi, konsistens for regulering tendens, og tall fra vev med over eller under-uttrykk ble også notert.

Tissue microarray analyse (TMA) ble også utført for tre tilfeldig plukket vanligste kreftgener (SPP1, BID og CLU) for å finne ut om mRNA endringer ble korrelert med endringer i proteinuttrykk hos kreftpasienter. Vevet microarray inneholder 200 tumorprøver med 50 prøver fra hver av fire krefttyper (tykktarm, bryst, eggstokk, og lunge). Analyse av SPP1 protein ekspresjon i tumor og normalt vev indikerte at SPP1 er til stede i cytoplasma og cellekjernen. De fleste prøver fra colon adenokarsinom, bryst adenokarsinom, eggstokk adenokarsinom, og lungekreft viste middels til sterk cytoplasmisk farging SPP1 i tumorceller, men fargingen i normalt vev var mye svakere. Gjennomsnittlig score for svulst og normalt vev er 11,1 ± 1,8 og 1,8 ± 1,5 i colon adenokarsinom (p = 0,0005), 10,9 ± 1,7 og 4,5 ± 3,8 i bryst adenokarsinom (p = 0,043), 11,7 ± 1,0 og 3,3 ± 4,2 i eggstokk adenocarcinoma (p = 0,028), og 9,0 ± 2,2 og 3,5 ± 2,0 i lungekreft (p = 0,0005), henholdsvis (figur 2 og figur S1). Positive cytoplasmisk farging av clusterin (CLU) var til stede på både tumor og normale celler i lunge, bryst, eggstokk og vev. Men sammenlignet med normale vev, redusert clusterin i lungekreft (5,6 ± 2,1

vs.

10,8 ± 1,6, p = 0,005), brystkreft (7,1 ± 2,7

vs.

10.5 ± 1,7, p = 0,017), og eggstokkreft (6,8 ± 3,0

vs.

10,5 ± 1,7, p = 0,011) (figur 3A, B og D). Tykktarmskreft viste mye mindre positive CLU flekker enn andre typer svulst, og det var ingen signifikant forskjell mellom kolon tumor og normal kolon vev (Figur 3C). BID protein ble signifikant oppregulert i tykktarmskreft, lungekreft og brystkreft, men ikke i eggstokkreft (data ikke vist). De gjennomsnittlige score til immunoreactive flekker i tumor og normalt vev er 11,2 ± 1,9

vs

. 2,0 ± 1,4 (p = 0,00015), 10,4 ± 2,2

vs

. 2,5 ± 2,2 (p = 0,0002 ) og 11,5 ± 1,4

vs.

6,5 ± 1,9 (p = 0,010) for disse tre krefttyper, henholdsvis (figur 3E-G). Semikvantitativ analyse viser at de fleste prøver fra ulike typer kreft har sterke, høy andel av BID immunologiske reaksjon, mens normalt vev bare vise lav til middels nivå av flekker; CLU tendens til å bli nedregulert i tumorer (figur 3 H). Resultatene viser at proteinnivå er i stor grad overens med den mRNA-ekspresjon av disse tre genene.

SPP1 positiv farging presenterer i cytoplasma og kjerne av tumorceller i lungekreft (A, til høyre), brystkreft (B, høyre ), eggstokk kreft (C, høyre), og tykktarmskreft (D, høyre) mens negativ farging i normal lunge (A, venstre) og eggstokk (C, til venstre), svak farging i normal bryst (B, til venstre), og kolon (D, til venstre).

Positiv cytoplasma farging av CLU gaver på både svulsten og normale celler i lunge, bryst, tykktarm og eggstokk vev (A til D). CLU uttrykk redusert i lungekreft (A, øvre nivå) sammenlignet med normal lunge (A, lavere nivå). Både normal bryst (B, lavere nivå) og eggstokk (D, lavere nivå) viser midten sterk farging i cytoplasma, og middels til svak flekker i brystet (B, øverste nivå) og eggstokkreft (D, øverste nivå). Mye mindre positive Clusterin farging stede i både tykktarm tumor (C, øverste nivå) og normalt vev (C, lavere nivå). BID viser sterk cytoplasma og nukleær farging i lungekreft (E, øverste nivå) og svake kjernefysiske farging i normal lunge epitel (E, lavere nivå). Økt sterke kjerne og cytoplasma farging er sett i brystsvulst (F, øverste nivå) sammenlignet med vanlig brystvev (F, lavere nivå). I tykktarmskreft, viser BID sterk cytoplasma og nukleær farging i tumorceller (G, øvre nivå), mens mindre positiv BID farging ble funnet i normal tykktarm vev (G, lavere nivå). Semikvantitativ analyse av CLU og BID immunoreaksjon i tumorer og normalt vev (H). De fleste av prøver fra ulike typer kreft har sterk, høy andel av BID immunologiske reaksjon, og normalt vev viser bare middels til lavt nivå flekker; mens CLU tendens til å nedregulert i tumorer (H). Høye = scorer 10-12, middel = scorer 6-9, og lave = scorer 1-5. Venstre kolonne i hvert panel er på lav effekt (100X) og høyre kolonne i hvert panel er på høy effekt (400X).

Vanlige kreft trasé i ulike krefttyper

Vi videre kartlagt en liste over 1,687 biologiske mekanismer som inkluderer metabolske veier, protein interaksjonsnettverk, signaloverføringsveier, og gennettverk å undersøke om flere gener innen en bestemt bane handling i en kumulativ måte å påvirke neoplastisk transformasjon og progresjon. Rikdommen av vesentlig forskjellig uttrykt gener i en gitt bane ble igjen evaluert av 100.000 permutasjon tester i treningsdatasettene. Pathway analyse viste at betydelige differensielt uttrykte gener (p 0,01) var for det meste beriket i glykolyse vei, cellesyklus sjekkpunkt II sti og plk3 vei, som omfattet 24, 10 og 10 gener, henholdsvis (p 10

-5) . Interessant nok har de fleste av de som er involvert i disse tre veier genene blir oppregulert i et stort flertall av cancervev sammenlignet med normale vev (Figur S2), noe som antyder forekomsten av genet hyperaktive og forsterkning i humane maligniteter.

bekreftelse av felles genuttrykk mønster i uavhengige datasett

Deretter bestemmes vi å validere vår genekspresjon signatur og se om vi kunne skille kreftprøver fra normale prøver i helt uavhengige datasett. Den diskriminerende effekt av 187-genekspresjon signatur i normale og tumorprøver ble testet ved clustering analyse ved hjelp av oligonukleotid genuttrykk data fra 19 helt uavhengige datasett. Datasett 21 til 38, som brukes til validering, besto av 211 normal og 492 tumorvev fra 14 forskjellige krefttyper. I de fleste av disse 18 datasett, ble prøvene deles inn i to grupper, en bestående av de fleste normale prøver og en annen for de fleste kreftprøver, basert på vår 187-genet signatur (figur S3). Den totale nøyaktighet korrekt klassifisering er, i gjennomsnitt, 92,64% i området fra 78% til 100% (tabell 4). Det skal bemerkes at datasettet 30 og 31 er litt forskjellige fra de andre datasett på grunn av heterogeniteten av kreftprøvene. Alle prøvene i disse to datasettene ble klassifisert i to store grupper: en som bare inneholder tumorprøver; den andre gruppen inneholder både svulster og normaler, som kan tydelig skilles som to undergrupper. Nærmere bestemt, i datasettet 30, åtte myelomcellelinjer dannet en gruppe med inkluderingen av en plasmacelleleukemi (PCL); i den andre gruppen ble åtte normale plasmacelleprøver og åtte prøver fra pasienter med myelomatose (MM) eller PCL tydelig delt. I datasettet 31, ble seks metastatisk prostatakreft prøvene grupperes sammen, mens normalt vev og primær prostata kreft var i den andre gruppen, med seks normalt vev og en primær prostatakreft hos en undergruppe, og seks primære prostatakreft i den andre undergruppen. I clustering analyse for tumorprøver av forskjellige undergrupper med genuttrykk data, er det ikke uvanlig at enkelte kreft undergrupper er nærmere normalgruppen, men er tydelig atskilt fra normalgruppen.

Datasett 39 inkludert 180 tumorprøver, som strekker seg over 14 vanlige krefttyper, og 81 prøver normalt vev. Blant 14 krefttyper, livmor adenokarsinom, leukemi og pleural mesothelioma var ikke til stede i de 20 trenings datasett. I clustering analyser, er prøvene gruppert i tre grupper: tumor gruppe jeg komponerer av 57 svulster og 20 normalt vev, normal gruppe komponering av 11 svulster og 53 normalt vev, og tumor gruppe II komponering av 112 tumor og 8 normalt vev (figur 4) . Nøyaktigheten av klassifiseringen er 85%. Alle sentrale nervesystemet kreft og de fleste av bukspyttkjertelen adenokarsinom ble klassifisert i tumor gruppe I, mens alle leukemi og de fleste av lymfomer ble klassifisert i tumor gruppe II. Spesielt, utfører 187-genet signatur godt (81-100%) i klassifisere nye krefttyper (for eksempel livmor adenokarsinom, leukemi og pleural mesothelioma). Det er også verdt å merke seg at det kun ~31-60% av gener fra denne 187 genet signatur som ble brukt i klyngeanalyser i hver av validerings datasett på grunn av spesifisitet plattformer, prøve tilgjengelighet og manglende verdier i microarray eksperimenter. Videre er det sett av gener som brukes for clustering analyser er delvis forskjellig mellom validerings datasett, avhengig av tilgjengeligheten av gen-ekspresjon av data i et bestemt studie. Dette demonstrerte robusthet, vaskerom og ubiquity av vår gen signatur. Til slutt har vi også forsøkt å klassifisere disse 261 prøvene ved hjelp av uttrykket profiler av 28 vanligste kreftgener bekreftet av QRT-PCR analyse med foldendring 3 og konsistens 60%. Den raffinerte 28-genet signatur likevel oppnådd ~80% nøyaktighet av klassifisering (figur S4). Det skal bemerkes at datasettet 39 benyttes en gammel microarray system av Affymetrix FL 6800 genet brikke med en total på 7,289 prober. Numrene på prober som brukes i de ovennevnte to clustering analyser for datasettet 39 var 72 og 19, svarende til 59 og 15 gener, respektivt.

Normale vev ble merket med sort og tumorvev ble merket med rødt. Prøvene er samlet inn i tre grupper: tumor gruppe jeg komponerer av 57 svulster og 20 normalt vev, normal gruppe komponering av 11 svulster og 53 normalt vev, og tumor gruppe II komponering av 112 tumor og 8 normalt vev. Alle sentrale nervesystemet kreft og de fleste av bukspyttkjertelen adenokarsinom ble klassifisert i tumor gruppe I, mens alle leukemi og de fleste av lymfomer ble klassifisert i tumor gruppe II. Nøyaktigheten av klassifiseringen er 85%.

Diskusjoner

DNA microarray-baserte gen-uttrykk klassifisering muliggjør en standardisert, objektiv vurdering av onkologisk diagnose og prognose og gir utfyllende informasjon til gjeldende klinisk protokoller [20]. Imidlertid er slike undersøkelser er typisk spesifikke for visse typer kreft, og de oppnådde ekspresjonsprofiler har begrenset bruk på grunn av utilstrekkelig validering i store pasientkullene. I denne studien har vi identifisert et gen signatur for molekylær kreftklassifisering gjennom en integrerende gen-uttrykk analyse av 20 forskjellige typer av felles kreft. Denne signaturen inneholder 187 gener hvis avvikende ekspresjon ble observert i nesten alle kreft vevsprøver, uavhengig av deres vev av opprinnelse. For å illustrere nytten og robusthet av denne signaturen, bestemt vi sin diskriminerende effekt på en annen 19 helt uavhengige datasett. Nøyaktigheten av klassifiseringen er ca 92,6% ved hjelp av denne felles kreft signatur. Interessant, kan en annen undergruppe av gener som står for 31-60% av den 187-genet signatur strengt identifisere kreftpasienter for et bredt spekter av humane maligniteter. Enda viktigere, denne signaturen utfører også godt i prediksjon av nye krefttyper som ikke var representert i den integrerende analyse i trenings datasett. Dette bekrefter at det identifiserte signaturen er krefttype-uavhengig og har fanget visse av de grunnleggende trekk ved transkripsjons neoplastisk transformasjon og progresjon generelt. Imidlertid er det fortsatt ukjent om alle disse genene i vår signatur er involvert i utviklingen av kreft. Noen av dem kan være en indikasjon på noe som skjer i kroppen som ledsager sykdommen prosessen; mens andre er gener

pe se

som fremmer tumordannelse og kreft progresjon. Vi sammenlignet også vår signatur med to andre signaturer i uavhengige datasett som tidligere ble brukt i disse studiene [21], [22]. Den totale nøyaktighet korrekt klassifisering ved hjelp av vår signatur er i gjennomsnitt 95% i området fra 90% til 100%; mens den totale nøyaktighet Rhode og Xu er 89% og 93%, henholdsvis (tabell S3). De to tidligere underskrifter ble bestemt enten fra samme sett av gener i en enkelt microarray plattform [21] eller felles gener mellom ulike plattformer [22]. De analyserte genene representerer bare en undergruppe av gener på genomet (ca 25%) og var svært overrepresentert i sine signaturer; mens de andre gener som ikke er presentert i den analyserte plattform eller ikke er vanlig blant plattformene ble savnet i sine signaturer. I denne studien, den foreslåtte metoden for å bestemme gen signatur er grei og uavhengig av ulike microarray plattformer (for eksempel ulike uncommercial cDNA chips og Affymetrix sjetonger). Derfor kan vi utnytte informasjon av alle genene i en bestemt mikromatrisestudie. Vår studie fremhever også viktigheten av den store prøven størrelse i mikromatriseanalyser for å identifisere og validere prognostiske signaturer. I denne studien har vi samlet sammen 2.186 prøver fra 39 uavhengige microarray studier for klassifikator oppdagelse og validering. Resultatene fra denne store integrerende gen-uttrykk analyse bør være mer robust og pålitelig enn hver av potensielt under-drevet enkeltstudier.

Vi har også identifisert flere vanlige veier hvor forandret uttrykket av flere gener fungerer i en felles vei til å påvirke kreftutvikling. Disse veier inkluderer de glykolyse, cellesyklus sjekkpunkt II og plk3 veier. Vi har funnet at mange av gener innenfor hver av banene ble oppregulert i forskjellige typer av tumorvev sammenlignet med normalt vev. Perturbasjonen av ekspresjon av multiple gener i disse baner kan være en felles egenskap ved neoplastisk transformasjon og progresjon i maligne svulster. Terapeutisk manipulering av disse baner kan tilveiebringe en universell strategi for behandling av mange typer kreft. For eksempel kreftceller ofte genererer energi gjennom glycolytic gjæring i stedet for oksidativ fosforylering. Det er mulig at den manglende oksidativ fosforylering begrenser produksjonen av proapoptotiske superoksyd. Tre enzymer i 187-genet profil, TPI, PGK1, og ENO1, som er involvert i glykolysen, ble også funnet å være betydelig overuttrykt i HER-2 /neu-positive brysttumorer [23]. Overekspresjon av disse enzymene kan godt forholde seg til de økte kravene til både energi og protein syntese /nedbryting av stier i det raskt voksende svulster. Denne veien ble foreslått til å være betydelig i tumorigenesis mer enn 70 år etter Warburg [24].

De genene som er identifisert i vår signatur kan være de viktigste målene for kreftbehandling og forebygging, siden de er dysregulerte i mange typer kreft. Karakterisering av disse vanlige genene skal gi muligheter for å belyse visse av de mer generelle mekanismer for kreft initiering og progresjon. Kreft genterapi klassisk innebærer levering av tumor suppressor, apoptose-induserende eller selvmordsgener direkte i kreftceller. Arrestasjonen av tumor celleproliferasjon er det ultimate målet for kreftbehandling. Interessant, i våre data, de identifiserte felles gener som er involvert i regulering av celleproliferasjon er alle oppregulert i forskjellige typer av tumorvev (Tabell S2). Disse genene inkluderer TTK, SPP1, NME1, NAP1L1, NPM1 og TNFSF13b. Osteopontin (SPP1) er et gen som regulerer celleproliferasjon. Mange studier har vist at SPP1 er sterkt uttrykt i flere ondartede sykdommer. Rikelig utskillelse av SPP1 fungerer som en markør for brystkreft og nedbrutt kreft, osteosarkom, glioblastom, plateepitelkarsinom og melanom [25]. Celler fra SPP1 knockout mus viser nedsatt kolonidannelse i soft agar og tregere tumorvekst

in vivo

i sammenligning med svulster i villtype mus [26]. I vår QRT-PCR-analyse, ble SPP1 overuttrykt i 18 ut av 22 prøver fra fem forskjellige typer av tumor-vev (figur 1). Vevet microarray analyse videre demonstrert at denne økte mRNA ekspresjonsnivå av SPP1 ble signifikant korrelert med protein-nivå hos kreftpasienter (figur 2). Således kan SPP1 være en lovende felles mål for kreft terapi og forebygging.

BH3-veksel domene død agonist (BID) og clusterin (CLU) finnes to andre potensielle terapeutiske mål som er involvert i programmert celledød. BID inneholder kun den BH3 domene, noe som er nødvendig for interaksjonen med BCL-2 familien proteiner og for sin pro-death aktivitet. BID er utsatt for proteolysespalting av caspases, calpainer, granzyme B og katepsin [27]. BID er viktig å celledød formidlet av disse proteaser og dermed er den sentinel å protease-mediert dødssignaler [28]. Protease-spaltet BID er i stand til å fremkalle flere mitokondrielle dysfunksjoner, inkludert utgivelsen av den inter-membran plass proteiner, cristae omorganisering, depolarisering, permeabilitet overgang og generering av reaktive oksygenforbindelser. Dermed BID er en molekylær bro som forbinder ulike perifere dødsveier til den sentrale mitokondriene veien. Nyere studier videre indikert at BID kan fungere som mer enn bare en proapoptotiske drapsmann molekyl. BID ikke bare fremmer cellesyklusprogresjon inn i S-fasen, men også involverer opprettholdelse av genomisk stabilitet ved å engasjere ved mitotiske sjekkpunkter [27]. Dette proteinet har forskjellige funksjoner som er viktige for både liv og død av cellen. En fersk studie viste at BID økt i hjernesvulst, hjernesvulst, prostatakreft, eggstokkreft og tykktarmskreft [29]. CLU er et sulfatert glykoprotein, innblandet i ulike cellefunksjoner som er involvert i kreftutvikling og tumorprogresjon, inkludert cellesyklusregulering, celle adhesjon, DNA-reparasjon og apoptose. Flere studier viser sterkt redusert uttrykk for CLU i tumorer sammenliknet med normalt vev, inkludert testikkel svulst, von Hippel-Lindau (pVHL) -defective nyretumor, esophageal plateepitelkarsinom [30] – [34]. Reduksjonen i det totale nivå CLU CLU vises fordi de positive stromale kamrene i normal slimhinne går tapt i tumor [35]. CLU spiller en negativ rolle i epitelcelleproliferasjon og mangel på CLU øker mottakelighet for tumordannelse etter kreftfremkallende utfordring. Den under uttrykk for CLU var umiddelbart klart i svært ondartet MD PR317 prostata adenokarcinomceller bruker laser mikrodisseksjon teknikk og serie analyse av genuttrykk [36]. Både vår QRT-PCR og vev microarray-analyser bekreftet oppregulering av BID og nedregulering av CLU i de fleste kreftvevet (figur 3).

Stamceller er de aller tidligste cellene i embryoet som deler og differensiere å danne modne organer og vev. Små mengder normale stamceller vedvare inn i voksen alder og funksjon for å vedlikeholde og reparere friskt vev. Det har nylig blitt etablert at, som normalt vev, er humane svulster initieres og vedlikeholdes av stamceller. Cancer stamceller eksistere som en minoritetsbefolkning i svulsten og deler mange genetiske og biologiske egenskaper ved normale stamceller. Noen gener overuttrykt i kreftvev identifisert i vår signatur ble funnet sterkt uttrykt i embryonale stamceller. For eksempel er den elektroniske pasientjournalen, NPM1, STAT1 og LSM4 høyere uttrykt i humane embryoniske stamcellelinjer sammenlignet med human universell RNA [37], [38]. CCNB1, FBXO2, NMe2, SNRPF, DDX21, SLC38A4, PSMA2, PSMA3 og AP1S2 er også høyere uttrykt i humane embryonale stamcellelinjer [37], [38], medlemmer av disse genfamiliene som CCNB2, FBXO32, NME1, SNRPB, DDX39, SLC38A1, PSMA4, PSMA7 og AP1S1 er observert i vår signatur. Spesielt to gener i vår signatur, DNMT1 og TAPBP, oppført på SuperArray GEArray S-serien Menneskelig Stem Cell Gene Array, som er designet for å profilere uttrykket av gener som er viktige for identifisering, vekst og differensiering av stamceller (Catalog antall HS-601,2, Superarray, Frederick, MD, https://www.superarray.com/home.php). Vår gen signatur inneholder også flere gener knyttet til vev utvikling, for eksempel regulering av utviklingsprosessen (FNDC3B, SPP1 og TTL), embryonal utvikling (ADAM10) og organutvikling (NCL, SPP1, SFXN1, BAX, ADAM12, NRP2 og NME1) ( https://fatigo.bioinfo.cnio.es).

i sammendraget, definerte vi en kreft-type-uavhengig gen signatur prediktiv av kreft status for et bredt spekter av menneskelige kreftformer. Denne signaturen har fanget avgjørende transcriptional overgangen fra normal celle atferd til ukontrollert cellevekst i maligne svulster og dermed har betydelige implikasjoner i kreftdiagnostikk, prognostics og terapi. Disse genene skulle vise seg aktuelt å ikke bare forstå vanlige molekylære mekanismen for kreft, og kreft diagnose, men også tjene som potensielle molekylære mål også.

Materialer og metoder

Datainnsamling og bearbeiding

Microarray datasett ble innhentet fra offentlige databaser. Data var av to generelle typer, dual channel ratio data tilsvarende flekket cDNA mikromatriser og enkeltkanal intensitet data tilsvarende Affymetrix mikromatriser. Tretti ni studier hadde 634 normal og 1,552 kreftprøver totalt (tabell S1). Alle disse tidligere studiene mikroarray ble opprinnelig utviklet for identifikasjon av differensielt uttrykte gener mellom normale og maligne tumorvevet for den bestemte type kreft. Patologi rapportene var grunnlag for klassifisere normale og tumor vev, og godartede og ondartede svulster i disse studiene. Datasett 1-20 som representerer 20 forskjellige vanlige krefttyper som blære, bryst, tykktarm, endometrial, nyre, lever, lunge, melanom, lymfom, bukspyttkjertel, prostata og skjoldbruskkjertelkreft ble brukt til å identifisere felles kreftgener og baner, og datasett 21 -39 ble brukt for omfattende validering. De utvalgte treningsdatasettene var normalt større enn validerings datasett bortsett flere svært nylig utgitte datasett. Alle ekspresjons-verdiene var basis-to-log transformert. For å lette multi-studie analyse, ble Unigene klynge ID og genet navn tildelt alle cDNA kloner og Affymetrix prober basert på NCBI Unigene Build 198 (https://www.ncbi.nlm.nih.gov/entrez/query. fcgidbunigene).

Påvisning av forskjellig uttrykt gener

Vi brukte to-utvalg permutasjon

t

test for å identifisere differensielt uttrykte gener (degs), som ble gjennomført i R pakke permax (https://www.r-project.org/), for hver av datasettene 1-20.

Legg att eit svar