Abstract
immunrespons relaterte gener spiller en stor rolle i kolorektal kreftutvikling ved å formidle betennelse eller immun-overvåking unndragelser. Selv bemerkelsesverdig fremgang har blitt gjort for å undersøke den underliggende mekanismen, ble forståelsen av kompliserte kreftutvikling prosessen enormt hindret av storskala svulst heterogenitet. Utvikling og kreft dele slående likheter i deres cellulære atferd og underliggende molekylære mekanismer. Sammenhengen mellom embryoutvikling og kreftutvikling gjør embryoutvikling en levedyktig referansemodell for å studere kreft derved unngå potensielt misvisende kompleksiteten av svulst heterogenitet. Her foreslo vi at immungener, ansvarlig for intra-immune cooperativity forvirring (i denne studien definert som avbrudd i utviklings uttrykk korrelasjonsmønstre under kreftutvikling), trolig inneholde uutnyttet prognostisk ressurs av tykktarmskreft. I denne studien vi bestemt mRNA ekspresjon profilen til 137 humane biopsiprøver, inkludert prøver fra forskjellige stadier av human colonic utvikling, kolorektal forstadier progresjon og kolorektal kreft prøver, hvorav 60 ble også brukt for å generere miRNA uttrykk profil. Vi opprinnelig etablert Spearman korrelasjon overgang modell for å kvantifisere cooperativity desorientering som er knyttet til overgangen fra normale til forstadier til kreft vev, i forbindelse med miRNA-mRNA regulatoriske nettverk og maskinlæringsalgoritme for å identifisere gener med prognostisk verdi. Til slutt ble en 12-gen signatur ekstrahert, hvis prognostisk verdi ble evaluert ved anvendelse av Kaplan-Meier-overlevelsesanalyse i fem uavhengige datasett. Bruke log-rank test ble 12-genet signatur nært knyttet til total overlevelse i fire datasett (GSE17536, n = 177,
p
= 0,0054; GSE17537, n = 55,
p
= 0,0039; GSE39582, n = 562,
p
= 0,13; GSE39084, n = 70,
p
= 0,11), og signifikant assosiert med sykdomsfri overlevelse i fire datasett (GSE17536 , n = 177,
p
= 0,0018; GSE17537, n = 55,
p
= 0,016; GSE39582, n = 557,
p
= 4.4e-05; GSE14333, n = 226,
p
= 0,032). Cox regresjonsanalyse bekreftet at 12-genet signatur var en faktor i å forutsi kolorektalkreft pasientens total overlevelse (hazard ratio: 1,759; 95% konfidensintervall: 1,126 til 2,746;
p
= 0,013], samt sykdomsfri overlevelse (hazard ratio: 2,116; 95% konfidensintervall: 1,324 til 3,380;
p
= 0,002)
Citation:. En N, Shi X, Zhang Y, Lv N, Feng L, Di X, et al (2015) Oppdagelsen av en roman immun Gene Signatur med Profound prognostisk verdi i tykktarmskreft.. en modell av Cooperativity Disorientation Laget i prosessen fra utvikling til kreft PLoS ONE 10 (9): e0137171. doi: 10,1371 /journal.pone.0137171
redaktør: Zhiqian Zhang, Peking University Cancer Hospital Institute, KINA
mottatt: 30.04.2015, Godkjent: 13 august 2015, publisert : 01.09.2015
Copyright:. © 2015 en m.fl. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forut den opprinnelige forfatteren og kilden krediteres
data~~POS=TRUNC Tilgjengelighet: den rå og bearbeidet data har blitt deponert i National Center for Biotechnology Information (NCBI) Gene Expression Omnibus database med serien deponeringsnummer GSE71187 (GEO) (mRNA data ) og GSE71130 (miRNA data)
Finansiering:. Dette arbeidet ble støttet av National High Technology Research and Development Program of China (SS2014AA020801, https://www.863.gov.cn/) og Sci Tech Development Program of Beijing (D121100004712002, https://www.bjkw.gov.cn/n8785584/index.html) mottatt av KZ. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP (CRC) er den tredje vanligste kreftformen hos menn (746,000 tilfeller, 10,0% av alle krefttilfeller) og den andre hos kvinner (614,000 tilfeller, 9,2% av alle krefttilfeller) over hele verden [1]. Til tross for betydelige fremskritt i forståelsen av den molekylære mekanismen, forblir CRC en vesentlig årsak til kreft dødelighet [2]. Tidligere forskere foreslått i stor skala heterogenitet skjedde i CRC [3-5], så vel som i mange andre typer av kreft [6-8]. Tumor heterogenitet utvikles gjennom en sekvens av hendelser, ledet av klonal seleksjon, hvor genomisk ustabilitet bidrar til å skape et mangfoldig cellepopulasjon som er gjenstand for seleksjon i en mikro-miljø eller terapeutisk sammenheng [9]. Derfor er en roman modell som deler likheter med kreft i form av celleatferdsmessige og molekylære egenskaper, men det er egentlig mer «organisert» presserende behov.
Det har vært mer enn 150 år siden Rudolf Virchow først foreslått at svulster oppstår «i samsvar med den samme loven som regulerer embryoutvikling» i 1858. Sammenhengen mellom embryoutvikling og kreftutvikling er viden rapportert. Videre er visse viktige utviklingsmessige gener involvert i kreftutvikling gjennom mutasjons aktivering [10]. Gjennom utviklingsdyremodeller, har molekylære mekanismer for carcinogenese blitt offentliggjort, og en rekke nye kreft-relaterte molekyler, stier og biomarkører identifisert [11-13]. Embryoutvikling og kreftutvikling også dele mange andre likheter med hensyn til mobilnettet oppførsel, inkludert epitelial til mesenchymale overgang (EMT) [14], mesenchymale-til-epitelial overgang (MET) [15], og immun-overvåkning unndragelser [16] . Samlet utgjør disse funnene tilby overbevisende bevis for at svulsten kan sees på som en avvikende organ som har kjøpt kapasitet for ubestemt spredning gjennom akkumulerte streiker [17], og at de molekylære hendelser som avviker kreftceller fra normale utviklingsbanen, er sannsynligvis ansvarlig for kreft initiering og progresjon.
Parvise genuttrykk sammenhenger (ved hjelp av Pearson korrelasjon) blir ofte brukt for å bestemme sammenhengen mellom gener i transcriptomic studier [18-20]. De parvise genuttrykk sammenhenger i utviklingsstadiet manifestere den fysiologiske nært eller fjernt foreninger av genet for genregulering. Vår studie tyder på at sammenhengen mellom gener innen en gitt funksjonell gruppe (immunrespons) viser en bemerkelsesverdig kompakt og synkronisert mønster av genekspresjon som sikrer tett regulering av colonic utvikling. For et gitt gen ble rangordnet dens korrelasjon med de gjenværende medlemmene av dette genet gruppen, som representerer den biologiske tilknytningen topologi, sannsynligvis forstyrret under kreftutvikling (regulatoriske forbindelser ble trinnvis byttet fra fysiologiske til patologisk status). Vi antok at hvis man ser en svulst som en avvikende utvikling organ, den skyldige gener ansvarlig for å forstyrre integriteten til dette koordinert genekspresjon korrelasjon mønster og mer spesifikt, forstyrre rangordnet sammenhengen mønster i dette spesielle genet gruppe under carcinogenesen, trolig holde dyp prognostisk informasjon. Vi definert dette konseptet som «cooperativity forvirring», og opprinnelig bygget en Spearman overgang modell for å kvantifisere cooperativity forvirring som oppstår i løpet av progresjon fra colonic utvikling til forstadier progresjon til kreft, heller enn å bare konsentrere seg om forskjellig uttrykte gener av spesifikke fenotyper.
microRNAs (mirnas) er en klasse av små ikke-kodende RNA, ~ 22 nt i lengde, som regulerer genekspresjon ved å binde seg til det 3′-ikke-translaterte området (3′-UTR) av målgener som fører til degradering eller protein oversettelse hemming av målgener [21]. Mirnas er spådd å regulere mer enn 60% av all protein-kodende gener hos pattedyr [22], og dermed regulerer nesten alle celleprosessen [23, 24]. Vi antok at mirnas spille en sentral rolle i CRC pasient overlevelse, og at nedstrøms målene for disse mirnas kan ha prognostisk verdi; denne strategien ble også vedtatt av Yang et al. [25] som viste at uttrykket av 219 miRNA-forbundet gener var assosiert med en mesenchymale subtype av serøs eggstokkreft assosiert med dårlig total overlevelse (OS) [25].
Selv om forholdet mellom cooperativity desorientering, embryonale utvikling og kreftutvikling er fortsatt ikke klart, det er sannsynlig at enkelte miRNA regulerte gener som spiller viktige roller i utviklingsstadiet og bidrar til cooperativity desorientering under kreftutvikling, kan ha en betydelig innvirkning på kreft transformasjon. Disse genene kan være lovende kandidat prognostiske biomarkører.
I denne studien har vi fokusert på immunresponsrelaterte gener. Immunresponsen og mer spesifikt, betennelse, har en dyptgående innflytelse på karsinogenese, som enten kan drepe tumorceller, eller, i noen tilfeller, kan mobiliseres for å lette karsinogenese [26]. Betydningen av immunrespons hos kreft bedt oss å bestemme prognostiske biomarkører for CRC. Vår er den første studie for å undersøke en rekke prøver, fra human tykktarm embryoutvikling, kolorektal forstadier progresjon, for å CRC prøver, for å simulere banen til human tykktarm utvikling og karsinogenese. Den Spearman overgang modellen vi foreslått her representerer det første skrittet i å identifisere den skyldige gener [differensielt uttrykte gener (degs) med en ny tolkning på grunnlag av uttrykket korrelasjon mønster] ansvarlig for å forstyrre organisert sammenheng mønsteret blant immunrelaterte gener ved kreftutvikling. Ved hjelp av mikromatriseteknologi og bioinformatikk analyser, identifiserte vi en 12-gen signatur med betydelig prognostisk verdi, noe som kan være klinisk relevant i fremtiden.
Materialer og metoder
En skjematisk for studien er avbildet i fig 1.
CRC
tykktarmskreft,
DVIG
utvikling varierende immun genet,
OS
total overlevelse,
DFS
sykdoms- overlevelse
Pasienter og prøver
i samsvar med prinsippene for gastrointestinal utviklingsbiologi [27], utvikle tykktarms prøver ble innhentet fra 20 abortsaker på Maternal Child Health Care Hospital of Hai Dian mellom 2007 og 2009. Prøvene tatt hele embryoer (vi) på tre til fem postovulatory uker (PWS), tidlige embryonale kolon (EØF) på åtte til ti PWS og midtre embryonale kolon (MEC) på 14 22 PWS. Innen 10 minutter av abort, ble vev skylles med fysiologisk saltvann, og hele embryo eller foster kolon ble nøye skilt fra fostervev med veiledning av en Nikon stereomikroskop SMZ1500 (Japan). Embryoer /fostre med kjent eller mistenkt genetiske lidelser ble ekskludert.
Normal kolorektal slimhinneprøver ble innsamlet fra pasienter med hemorroider som fikk kirurgisk fjerning ved Institutt for tykktarms- og endetarms Surgery av Beijing Shi Ji Tan Hospital mellom 2009 og 2010 . femtito CRC prøver med OS informasjon ble innhentet under kirurgisk fjerning fra Zhe Jiang University School of Medicine. Koloskopi biopsiprøver, inkludert tykktarms adenomer og adenokarsinomer ble innhentet fra Institutt for Endoskopi, Cancer Hospital, Chinese Academy of Medical Sciences, mellom 2008 og 2011. Pasienter med historien om familiær adenomatøs polypose, arvelig non-polypose CRC, eller inflammatorisk tarmsykdom ble ekskludert. Adenom er definert som dysplasi, carcinoma in situ, mistenkt for invasivt karsinom og intramucosal karsinom; den adenokarsinom er definert som submucosal invasjon av adenokarsinom [28]. Fire til seks områder ble skåret ut fra kolorektale neoplasi prøver, inkludert kantene og midten av lesjon, ifølge ASGE retningslinje [29]. Vevsprøver ble tatt hurtigfrosset i flytende nitrogen umiddelbart etter biopsi eller kirurgi og lagret ved -80 ° C. En del av alle prøvene ble underkastet patologisk analyse utført av to uavhengige, forblindet og erfarne patologer. Prøver fornøyd med de diagnostiske kriteriene for normal slimhinne og neoplasi (neoplastiske celler 70%) ble registrert. Hvis mer enn en biopsiprøve tatt fra samme pasient, ble disse prøver slått sammen. Alle givere signert informert samtykke former. Bruken av menneskelige vevsprøver og de eksperimentelle prosedyrer for denne studien ble gjennomgått og godkjent av etikkomiteen av Cancer Institute og Hospital, Chinese Academy of Medical Sciences.
RNA isolering
Total RNA ble hentet fra frosne vev ved hjelp TRIzol RNA isolering reagens (Invitrogen, Carlsbad, CA, USA) i henhold til produsentens spesifikasjoner. RNA integritet ble evaluert ved hjelp av en 2100 Bioanalyzer (Agilent Technologies, Santa Clara, CA, USA). Dersom RNA integritet var antallet ≥ 5, er den totale RNA ble ytterligere renset ved anvendelse av RNeasy Mini Kit (Cat No.74106, Qiagen, Tyskland). RNA-konsentrasjoner ble bestemt med en Nanodrop ND-1000 spektrofotometer (Nanodrop Technologies, Wilmington, USA).
microarray uttrykk profilering og data normalisering
Etter histopatologisk evaluering og RNA integritet analyse, alle prøvene var analysert ved hjelp av Agilent mikromatriser. Biopsiprøver inkludert 6 VI, 6 EEC, 8 MEC, 12 normal, 58 adenom og 47 adenokarsinom prøver ble brukt til mRNA microarray analyse; Av disse ble 60 prøver (2 WE, 6 EEC, 8 MEC, 11 normal, 9 adenom og 24 adenokarsinom prøver) også brukes til miRNA microarray analyse. Purified total RNA prøver ble merket og hybridisert til Agilent 4 × 44K Whole Human Genome Oligo Mikromatriser (G4112F) i henhold til produsentens instruksjoner. For miRNA arrays, ble total RNA analysert med en Agilent 8 × 15K Menneskelig miRNA microarray V3 (G4470C).
mRNA og miRNA microarray rådata ble normalisert ved hjelp av GeneSpring GX-programvare, versjon 11.5 (Silicon Genetics, Redwood City, CA, USA). For mRNA uttrykket data, ble totalt 41,091 enkelt prober oppnådd i henhold til GeneSpring standardinnstilling. Uttrykket verdi for et bestemt gen, ble bestemt som den midlere verdi av alle probene tilordning til dette genet. Til slutt ble de uttrykk verdiene av 18,986 gener oppnådd. Målte mirnas ble ansett liggende hvis deres signal kunne påvises i minst 50% av prøvene innenfor hver prøvetype. Uttrykket profiler ble kjøpt for 96 miRNAs. Den rå og bearbeidede data har blitt deponert i National Center for Biotechnology Information (NCBI) Gene Expression Omnibus database med serien deponeringsnummer GSE71187 (mRNA data) og GSE71130 (miRNA data) (GEO).
Affymetrix microarray datainnsamling, forbehandling, og normalisering
rådata til fem menneskelige kolorektal kreft mRNA microarray studier (tabell 1) ble lastet ned fra GEO. Den kombinerte datasettet inneholdt til sammen 1094 prøver ble behandlet på Affymetrix HG-U133A plus2 (GPL570) arrays, som inneholder 52,475 sonder. Normaliserte uttrykk verdier ble oppnådd via robust multi-matrise gjennomsnitt (RMA) algoritme og videre quantile normalisert ved hjelp av «AFFY» Bioconductor pakken. Combat algoritme ble brukt til å eliminere potensielle batch effekter med Bioconductor pakken «inSilicoMerging». Uttrykket nivåer av 20,184 gener ble oppnådd som middelverdien av alle probene tilordning til et bestemt gen. All klinisk informasjon ble hentet fra de originale publikasjoner. Blant disse fem datasett, GSE17536, GSE17537 og GSE39582 inneholde både OS og sykdomsfri overlevelse (DFS) informasjon. GSE39084 inneholder OS data, mens GSE14333 inneholder DFS informasjon.
Identifisere «utviklings varierende immunrelaterte gener» (DVIGs)
VI, EEC, MEC og normale prøver representert prøver på ulike stadier av menneskelige colonic utvikling; adenomer ble betraktet som forstadier til kreft; og adenokarsinomer representerte kreft stadium. Gener som falt under Gene ontologi (https://www.geneontology.org) term GO: 0006955 ble ansett immunresponsrelaterte gener; Dette resulterte i 1028 gener som 972 var til stede i våre mRNA microarray data. ANOVA ble brukt til å hente 665 DVIGs som ble forskjellig uttrykt i utviklingsstadiet (FDR 0,0001).
Etablering av Spearman overgang modellen
En detaljert beskrivelse av Spearman overgangen modellen er presentert i S1 metoder.
Bygging av en miRNA-mRNA regulatoriske nettverk
en miRNA-mRNA regulatoriske nettverk ble generert basert på sekvens algoritmer (Miranda [30], TargetScan [31], PicTar [32] ) og microarray data (60 biopsiprøver med både miRNA og mRNA microarray data). En miRNA-mRNA regulatoriske paret ble betraktet som fast bare hvis de fornøyd minst to sekvens algoritmer og hvis deres uttrykk nivåer signifikant og negativt korrelert (FDR 0,01).
Etablering av en CRC gen signatur ved hjelp av maskinlæring søkt til mRNA uttrykk profiler av primære kliniske prøver
av de 52 kirurgisk skåret CRC prøver, valgte vi 19 og 22 tilfeller der pasienter overlevde lenger ( «Good gruppe») eller kortere ( «Poor gruppe») enn fem år ( etter operasjonen) for å trene en tilfeldig skoger maskinlæring modell. Kort fortalt gener ble bestilt av gjennomsnittlig reduksjon Gini (MDG) kriterium, hvor genene er rangert etter graden av innflytelse på resultatene av den tilfeldige skog klassifisering; la en ut kryssvalidering (LOOCV) for å estimere «Poor stemme» del av testen saken, som ble ytterligere behandlet som prediktor mottaker drift karakteristikk (ROC) test. Gener ble så rekursivt eliminert basert på den opprinnelige genet rangering, inntil arealet under ROC-kurven (AUC) ble optimalisert. Denne algoritmen er tydelig beskrevet i tidligere forskning som AUC-RF algoritme [33].
Kaplan-Meier overlevelsesanalyse og Cox regresjonsanalyse
Prinsipal komponent analyse (PCA) ble utført ved bruk av gener interesse for hver nedlastet Affymetrix datasett. Den første hovedkomponent (PC1) fanger opp den største mengden av den totale varians i profilene og er beregnet for hver pasient. Pasientene ble så delt i to grupper av lik størrelse basert på den rangordnet PC1 på tvers av deres tumor profiler. Kaplan-Meier overlevelsesanalyse og log-rank test ble brukt for å evaluere den prognostiske forskjellen mellom de to PC1-tildelt grupper [12]. Den Cox regresjonsmodell ble brukt til å vurdere uavhengighet av prognostiske faktorer på en trinnvis måte. Prøvene i den kombinerte Affymetrix datasettet (1094 prøver) med fullstendig informasjon om alder, kjønn, amerikanske Joint Committee on Cancer (AJCC) (trinn), patologisk grad (grad) og overlevelse informasjon ble brukt (213 prøver for OS Cox analyse og 213 prøver for DFS Cox analyse), og en verdi på
p
0,05 ble ansett som signifikant.
Gene signaturvalidering ved hjelp av tilfeldig genet prøvetaking
Vår strategi var å velge en liten gen signatur med betydelig prognostisk verdi av innsnevring ned gener av interesse i en trinnvis måte. For å bevise at denne metoden virkelig spådd overlevelse utfallet, n-genet (hvor den endelige gensignaturen inneholder n gener) tilfeldige prøvetakinger ble utført 2000 ganger i hvert gen bassenget. Kaplan-Meier overlevelsesanalyse ble utført med tilfeldig valgte n gener, og hvor mange ganger det tilfeldig valgte gener kan samtidig diskriminere alle de mål overlevelsesdatasettene ble registrert.
Statistiske analyser
Alle statistiske analyser ble henrettet ved hjelp av R-prosjektet programvaren (versjon 2.15.1), og Bioconductor (versjon 2.11). R pakker «randomForest» (versjon 4,6 til 7) [34] og «Proc» (versjon 1.7.1) [35] ble brukt til å konstruere AUC-RF modell. Differensielt uttrykte gener ble oppnådd ved bruk av R-pakken «samr». Kaplan-Meier overlevelsesanalyse ble utført med R-pakken «overleve». Den Bioconductor annotering pakken «org.Hs.eg.db» (versjon 2.8.0) ble anvendt for å hente immunrelaterte gener [36]. Kartlegginger mellom Affymetrix prober og Entrez genet identifikatorer ble utført ved hjelp av Bioconductor pakken «hgu133plus2.db». Meta-analyse ble utført med R-pakken «meta», og skog tomter ble gjort ved hjelp av R-pakken «rmeta». Network visualisering ble utført i Cytoscape (versjon 3.2.0) [37].
Resultater
gener differensielt uttrykt mellom normal og CRC vev er betydelig beriket for Reactome begrepet «signalering i immunsystemet»
Forskjellig uttrykte gener (degs) mellom normale og CRC vev ble identifisert ved hjelp av SAM-algoritmen (FDR 1e-07). Degs inkludert 3,226 og 2,538 betydelig opp- og downregulated gener i CRC. Bruke Reactome berikelse analyse, utført med David Bioinformatikk Resources 6,7 (https://david.abcc.ncifcrf.gov/), fant vi at Reactome begrepet «signalering i immunsystemet» ble betydelig anriket på CRC (Bonferroni justert
p
verdi = 0,004), noe som tyder på en signifikant sammenheng mellom kreftutvikling og immunrelaterte gener (S1 Table).
Pearson korrelasjon heatmaps
Parvise Pearson korrelasjoner mellom de 665 DVIGs ble beregnet og justeres for å eliminere skjevhet (justert metoden ble beskrevet i S1 Methods). Pearson korrelasjonsheatmaps (665 × 665) ble konstruert for kolon prøver under kolon utvikling (figur 2A), progresjon (Fig 2B) og kreft (figur 2C) stadier. Under utviklingsstadiet, ble tre forskjellige klynger oppnådd. Distinkte klynger var imidlertid ikke tydelig under progresjon og kreft stadier. Ved overlagring av de tre Pearson korrelasjonstetthetskurver (fig 2D), ble en klar bimodal fordeling sett på utviklingsstadiet, i motsetning til den unimodale fordelinger av progresjon og kreft etapper. Videre er kreft stadium hadde en høyere maksimal tetthet ved en Pearson korrelasjon på null i forhold til progresjon eller utviklingsstadier.
Heatmaps av justerte Pearson korrelasjoner for 665 DVIGs i (A) utvikling, (B) forstadier og progresjon (C) kreft, respektivt. Gener ble gruppert i tre klynger (markert med forskjellige farger) ved UCA. (D) Tetthet tomt på parvise justerte Pearson korrelasjoner for alle tre trinn. Kurven for utviklingsstadiet er bimodal distribusjon, men unimodal for i progresjon og kreft etapper. For å gjengi intra-immune vektorer sammenlignbare, ble genene omorganiseres i progresjon og kreft scenen heatmaps for å matche den rekkefølgen utviklingsfasen heatmap, å generere (E) omorganiseres progresjon heatmap og (F) omorganiseres kreft heatmap.
DVIG
, utvikling varierende immun genet;
UCA
, uten tilsyn clustering algoritmen.
«Obedient gener» ble filtrert ut ved hjelp av Spearman overgang modell
Pearson korrelasjonsheatmaps av DVIGs løpet av progresjon og kreft stadier var omorganiseres for å gjøre alle tre stadier (fig 2E og 2F, beskrevet i S1 Methods). Som vist i figur 3A, ble 665 DVIGs projisert på en Spearman overgang koordinatsystem, med den Spearman overgangen mellom utvikling og progresjon (STD-P, S1 Methods) og mellom progresjon og kreft (STP-C, S1 Metoder) som x og y-akse-koordinatene, respektivt. Gener ble farget på samme måte som i utviklings heatmap clustering i figur 2A. Av de 665 DVIGs, 385 (kalt «lydige gener») falt i kvartalet sirkelens bue, mens de resterende 280 (kalt «avledning gener») falt utenfor denne buen og ble brukt som kandidater for nedstrømsutvelgelsesprosedyrer.
(A) 665 DVIGs ble projisert på en Spearman korrelasjon overgang koordinatsystem basert på deres cooperativity forvirring mellom de påfølgende stadier. Gener ble farget på samme måte som i utviklingen heatmap. (B) AUC-RF algoritme ble anvendt for genet signatur optimalisering. Gener ble rekursivt fjernet fra en betydning bestilt genet listen til den største AUC-verdien ble oppfylt. (C) Den største AUC av 0,904 (95%
CI
: 0,799 ~ 1,000) oppnådd når det antall gener ble redusert til 12, med 81,8% følsomhet (95%
CI
: 0,636 til 0,955) og 89,5% spesifisitet (95%
CI
: 0,737 til 1,000).
Dev
, utvikling;
Prog
, progresjon;
TPS
teoretisk stabilt punkt;
AUC
, areal under kurven;
DVIG
, utvikling varierende immun genet;
CI
, konfidensintervall.
Diversion gener med en eller flere miRNA regulatorer bodde i genbanken
Bruke paret mRNA og miRNA data som var tilgjengelige for 60 av CRC biopsiprøver, bygget vi en miRNA-mRNA regulatoriske nettverk for å velge avledning gener som hadde minst en miRNA regulator (S1 Methods). Dette resulterte i 59 avledning gener som potensielt ble regulert av 37 mirnas (fig 4, S2 tabell).
Mørke gule nodene representerer miRNAs. Rød og safir noder representerer mRNA, blant disse røde er genene i 12-genet signatur. Regissert solide kanter representerer miRNA-mRNA regulering.
Gene signatur optimalisering av AUC-RF algoritme
De 59 avledning genene ble ytterligere snevret ned disse 59 gener for å få undergruppe av gener som gir best prognostisk ytelse. Disse genene ble først beordret i henhold til deres betydning i diskriminerende tilfeller av OS (lengre eller kortere enn 5 år) ved hjelp av tilfeldige skog algoritmen; gener ble deretter rekursivt eliminert fra bunnen av denne listen til arealet under ROC-kurven (AUC) ble optimalisert (AUC = 0,904, 95%
CI
: 0,799 til 1,000, figur 3B). Dette resulterte i en optimalisert 12-genet signatur som hadde 81,8% sensitivitet (95%
CI
: 0,636 til 0,955) og 89,5% spesifisitet (95%
CI
: 0,737 til 1,000) i diskriminerende dårlig fra god OS i 52 kirurgi prøver med en «dårlig» stemme andel av 0,560 (fig 3C). Denne 12-genet signatur består av
AXL
,
BCI3
,
COLEC12
,
ABR
,
PXDN
,
EP300
,
JAM3
,
MAP3K1
,
CASP8
,
RPS6KA1
,
Chuk
, og
RPS6KA2
, og er regulert av 16 mirnas (fig 4).
Kaplan-Meier overlevelse og Cox regresjonsanalyse bekreftet gyldigheten av 12-genet signatur
Kaplan-Meier overlevelsesanalyse ble utført for å evaluere den prognostiske verdi av 12-genet signatur i fem Affymetrix datasett som hentes fra GEO databasen. Den log-rank Resultatene bekrefter at 12-genet signatur var nært knyttet til OS i fire datasett (figur 5A; GSE17536, n = 177,
p
= 0,0054; GSE17537, n = 55,
p
= 0,0039; GSE39582, n = 562,
p
= 0,13; GSE39084, n = 70,
p
= 0,11). Videre denne 12-genet signatur var signifikant assosiert med DFS i fire datasett (figur 5B, GSE17536, n = 177,
p
= 0,0018; GSE17537, n = 55,
p
= 0,016 ; GSE39582, n = 557,
p
= 4.4e-05, GSE14333, n = 226,
p
= 0,032). Cox regresjonsanalyse også bekreftet at 12-genet signatur var en faktor i å forutsi CRC pasientens OS [Tabell 2; hasardratio (
HR
): 1,759; 95%
CI
: 1,126 til 2,746;
p
= 0,013], samt DFS (tabell 2;
HR
: 2,116; 95%
CI
: 1,324 til 3,380;
p
= 0,002). Meta-analyse ble utført for å evaluere sammenhengen mellom hver av de 12 genene og overlevelse (OS: GSE17536, GSE17537, GSE39582 og GSE39084, og DFS: GSE17536, GSE17537, GSE39582 og GSE14333) av CRC pasienter med fast effekt modell (Fig 6A ) og random-effekt modell (fig 6B).
Kaplan-Meier overlevelsesanalyser og log-rank tester ble utført for å evaluere den prognostiske verdien av 12-genet signatur. (A) Ytelsen til 12-genet signatur i OS diskriminering. Datasett med OS informasjon var GSE17536, GSE17537, GSE39582 og GSE39084. (B) Ytelsen til 12-genet signatur i DFS diskriminering. Datasett med DFS informasjon var GSE17536, GSE17537, GSE39582 og GSE14333.
OS
, total overlevelse;
DFS
, sykdomsfri overlevelse.
(A) Forest tomt på sammenhengen mellom individuelle gener og OS med en fast effekt modellen i datasett som inneholder OS informasjon (GSE17536, GSE17537 , GSE39582 og GSE39084). Meta-analyse av disse 12 gener i fire uavhengige datasett ble gjennomført, og
HR
, 95%
CI
av hvert gen og tilsvarende
p
verdi ble beregnet og plottet i skogen tomten. (B) Forest tomt på sammenhengen mellom individuelle gener og DFS med en tilfeldig-effekt modellen i fire datasett som inneholder DFS informasjon (GSE17536, GSE17537, GSE39582 og GSE14333).
CRC
, tykktarmskreft;
HR
, hazard ratio;
CI
; konfidensintervall;
OS
, total overlevelse;
DFS
, sykdomsfri overlevelse.
Tilfeldig genet prøvetaking bekreftet gyldigheten av vår metodikk
For å bekrefte gyldigheten av vår signatur utvelgelsesprosess, en 12-gen panel ble tilfeldig samplet 2000 ganger over de 972 immunrelaterte gener, 665 DVIGs, 280 avledning gener og 59 miRNA-regulert gener, henholdsvis. Antall ganger at en tilfeldig valgt 12-gen panel kan samtidig diskriminerer overlevelse datasett (OS og DFS i GSE17536 og GSE17537, DFS i GSE39582 og GSE14333), var 0, 0, 9 og 33 for de nevnte fire genet grupper, henholdsvis , som gir sterke bevis for gyldigheten av vår hypotese og gen signatur-utvalg rørledning (figur 7A).
(A) Bar tomt på antall ganger at 12 tilfeldig utvalgte gener kan samtidig diskriminerer fire overlevelses datasett (OS og DFS i GES17536 og GSE17537, DFS i GSE39582 og GSE14333). (B) Heatmap av 137 biopsiprøver etablert med mRNA-ekspresjon profil av den 12-genet signatur. MRNA rådata ble normalisert og deretter filtrert (se «Materialer og metoder»). Rader representerer gener, og kolonner representerer biopsiprøver. Rader, i stedet for søyler, ble sortert på nytt ved hjelp av UCA, mens prøver av samme type ble plassert sammen.
DVIG
, utvikling varierende immun genet;
UCA
, uten tilsyn clustering algoritmen;
OS
, total overlevelse;
DFS
, sykdomsfri overlevelse.
Diskusjoner
Den intime sammenhengen mellom fosterutviklingen og kreftutvikling gjør embryoutvikling en levedyktig referansemodell for å studere kreft, som omgår potensielt misvisende kompleksiteten forbundet med svulst heterogenitet.