PLoS ONE: Cancer Risk Module Identifisering og modulbasert Disease Risk Evaluation: A Case Study på Lung Cancer

Abstract

genuttrykk profiler har trukket bred oppmerksomhet i å tyde patogenesen av kreft hos mennesker. Kreft-relaterte genet moduler kunne identifiseres i co-uttrykk nettverk og brukes til å legge til rette for kreftforskning og klinisk diagnose. I denne utredningen, ble en ny metode foreslått å identifisere lungekreft-risikomoduler og vurdere modulbaserte sykdomsrisiko av prøver. Resultatene viste at tretti en kreft-risiko modulene var nært knyttet til lungekreft genene på funksjonsnivå og interaksjonell nivå, noe som indikerer at disse modulene og gener kan synergi føre til forekomsten av lungekreft. Vår metode ble vist seg å ha god robusthet ved å evaluere sykdomsrisiko av prøver i åtte kreft ekspresjons-profiler (fire for lungekreft og fire for andre kreftformer), og hadde bedre ytelse enn den WGCNA metoden. Denne metoden kan gi hjelp til diagnostisering og behandling av kreft og en ny ledetråd for å forklare kreftmekanismer

Citation. Jia X, Miao Z, Li W, Zhang L, Feng C, Han Y, et al. (2014) Cancer Risk Module Identifisering og modulbasert Disease Risk Evaluation: A Case Study på lungekreft. PLoS ONE 9 (3): e92395. doi: 10,1371 /journal.pone.0092395

Redaktør: Ying Xu, University of Georgia, USA

mottatt: 12 juli 2013; Godkjent: 21 februar 2014; Publisert: 18 mars 2014

Copyright: © 2014 Jia et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Bevilgninger gitt av Natural Science Foundation National of China (nr 61272388 og nr 31301040); Oversea Scholars Prosjekt finansiert av undervisningsavdeling i Heilongjiang-provinsen (NO 1155H012.); og mester Innovasjon Fond i Heilongjiang-provinsen (No. YJSCX2012-209HLJ og YJSCX2012-224HLJ). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Kreft er forårsaket av avvik av flere gener, og dermed dets patogenese er meget komplisert og usikker [1], [2], [3]. Kreftrelaterte gener har ulike funksjoner [4], [5], mens gener med lignende funksjoner er sannsynlig å være co-uttrykk [6], [7] og plassert i nærområder (kjent som nettverksmoduler) [8], [ ,,,0],9] i biologiske nettverk. Modulene avsløre mekanismen for multiple gener som ligger til grunn for sykdommen og vurdere risiko for sykdommen. Effektiv identifikasjon av kreft risikomoduler kan hjelpe til kreft forskere [10], [11], [12], [13].

Disease risiko for kreft-relaterte moduler beregnet fra en bestemt biologisk bakgrunn kan være en betydelig grad for klinisk prediksjon av kreftdiagnose [14], [15], [16], [17], [18]. Flere beregningsfremgangsmåter er blitt utviklet for den sykdomsrisiko modulen analyse, herunder deteksjon av differensielt korrelerte gensamlingene og genspesifikke analyse baserte ko-ekspresjon nettverk [19], [20], [21], [22]. For eksempel, vektet gen co-uttrykk nettverksanalyse (WGCNA) er en moden teknikk og identifiserer genet moduler som kandidat biomarkører eller terapeutiske mål basert på co-uttrykk nettverk [23], [24]. WGCNA har blitt brukt til å studere komplekse sykdommer, for eksempel metabolsk syndrom [25], schizofreni [26], og hjertesvikt [27]. Uttrykket aktiviteter sykdommer risikomoduler ble (indusert eller undertrykt) forskjellig blant kliniske tilstander (i tumor pågår) [14].

Videre er det mulig å identifisere kreft risikomoduler fra co-uttrykk nettverk ved hjelp av nettet baserte metoder. Analysen av gene koekspresjon nettverk viser at gener innenfor de samme modulene ser ut til å ha lignende uttrykk mønstre, har felles reguleringsmekanismer [28], [29], [30], og således har sterke assosiasjoner med spesielle biologiske funksjoner som bestemmer atferd eller fenotyper celler [31], [32]. Moduler avledet fra co-uttrykk nettverk ble organisert i en høyere orden struktur korrelert med kliniske kjennetegn, som ga innsikt i underliggende biologi glioma [33]. Fire moduler av eggstokkreft fra en co-uttrykk nettverk ble preget til å være signifikant assosiert med biologiske prosesser som cellesyklus og DNA replikasjon i Gene ontologi (GO) kategorier [34]. De co-uttrykk moduler knyttet til T-hjelper differensiering og TGF-beta trasé forbedret klinisk resultat av hormon-insensitive brystkreft etter behandling [35]. Dessuten ville prøve signatur /etiketter vurderes i evaluering av kreftrelaterte risikomoduler tilby en ny ledetråd for å avsløre mekanismene for sykdommer [36]. Undersøkelser har vist at det er nødvendig å undersøke forholdet mellom genfunksjoner og sykdomsrisiko [37], [38]. De co-uttrykk nettverk som tar hensyn til biologiske funksjoner vil være mer robust og autentisk [39], [40], og modulene hentet fra disse nettverkene kan bedre reflektere funksjon informasjon av sykdommene.

I denne papir, en ny metode ble foreslått for å identifisere kreftrisiko moduler og evaluere modulbasert sykdom risiko av prøver. En svært selvsikker co-uttrykk nettverk med funksjonelle likheten informasjonen ble først bygget ved hjelp av uttrykk profiler i lungekreft, og deretter kandidat modulene ble identifisert. De kreftrisiko av modulene ble scoret ved å innføre prøve etiketter, da de betydelige kreftrisikomoduler ble vist ut av randomiserte studier. Til slutt ble sykdom risiko for prøvene vurdert basert på kreft-risikomoduler. Disse modulene var forventet å gi bevis for sykdom diagnose, behandling og klinisk analyse i fremtiden. Identifisering av kreft-risiko moduler og evaluering av modulbaserte sykdomsrisiko ble utført i følgende trinn (figur 1).

Materialer og metoder

Material

kreft genuttrykk data ble innhentet fra Gene Expression Omnibus (GEO, https://www.ncbi.nlm.nih.gov/geo/)[37]. Her ble vår forskning basert på profilen GSE7670 [41] i GPL96 inkludert 20,995 gener av 56 prøver (28 lungekreftpasienter og 28 friske kontrollpersoner), for hvilke pasienter som gjennomgikk kirurgi for lungekreft ved Taipei Veterans General Hospital. Disse uttrykk profiler (GSE10072, GSE21933, GSE27262, GSE40791, GSE14520, GSE15781, GSE20437, GSE26126) (Tabell 1) med sykdom og normale prøver ble brukt til å analysere robustheten vår metode og sammenligne med WGCNA metoden. Gene funksjon informasjonen ble hentet fra Gene ontologi (GO, https://www.geneontology.org/) [42], oppdatert til mai 2011. Protein interaksjoner informasjon (95537 høy grad av tillit interaksjoner mellom 12359 gener) ble lastet ned fra iRefWeb (http : //www.wodaklab.org/iRefWeb/) [43], oppdatert til den 13 april 2012 av niende versjonen. Informasjonen fra 1824 protein komplekser er innhentet fra München Information Center for proteinsekvenser (MIPS, https://mips.helmholtz-muenchen.de/genre/proj/corum, Corum Slipp februar 2012 tilgjengelig).

en. Byggingen av en svært trygg co-uttrykk nettverk.

ble innført en metode for å skape et svært trygg co-uttrykk nettverk ved å ta både co-uttrykk korrelasjon og funksjonelle likheten. Denne metoden ble utført som følger:

Først Pearson korrelasjonskoeffisient [44]

r

ble brukt til å representere den koekspresjon forholdet mellom hvert par av gener og beregnes som følger: hvor

N

er antall prøver i et uttrykk profil,

x

i

og

y

i

er uttrykket nivåer av gener

x

og

y

i

i

-te prøven.

for det andre, går semantiske likheten ble brukt til å representere den funksjonelle likheten mellom hvert par av gener [45].

(1) likheten score på GO sikt A ble definert som:

der omfatter begrepet A og alle de overordnede vilkår; er vekten av kanten; og det er 0,8 for «er-en relasjon og 0,6 for» del-av «forhold

(2) Den semantiske likheten mellom begrepet A og begrep B, ble beregnet som følger:.

et gen funksjoner ble ansett som et sett av GO vilkår i Gene ontologi. Dermed funksjoner av gener G1 og G2 samsvarer GO settene, og

m Hotell og

n

er antall ledd i henholdsvis GO1 og GO2.

(3) semantiske likheten mellom G1 og G2 ble definert som:

den robuste genet parene ble beholdt av funksjonen likheten. Derfor ble en svært trygg co-uttrykk nettverk konstruert ved å analysere Pearson korrelasjonskoeffisient og GO semantisk likhet.

b. Differensial genet valg basert på bayesiansk modell.

En bayesiansk modell [46], [47] ble benyttet for å undersøke differensial gener. Bayesian tilnærminger sammenligne sannsynligheten for at en forbindelse mellom et genekspresjon og en sykdom til sannsynligheten gis ingen slik krets. Formelen var som følger: der

n

1

T

,

n

2

T

,

n

2

N Hotell og

n

2

N

er antall prøver (tumor /normal og høy /lav uttrykk) for ett gen (tabell 2). B betegner Beta funksjon, definert av

milliarder

er loggen verdien av B.

Når

BFLn

0, var forholdet mellom en sykdom og genekspresjon; når

BFLn

. 0, ingen sammenheng

En randomisert test ble utviklet for å beregne betydningen av

BFLn

av stokastisk å forstyrre

n

1

T

,

n

2

T

,

n

2

N Hotell og

n

2

N Hotell og beholde stabil sum; etter 10.000 ganger,

p

-verdi var andelen når det tilfeldige

BFLn

var større enn den reelle verdien. Gener med p 0,05 ble valgt som differensielt uttrykte gener (DE-gener)

c.. Identifisering av kreft-risikomoduler.

Den elektroniske modulen gruvedrift verktøy GraphWeb (https://biit.cs.ut.ee/graphweb/) [48] ble valgt til å finne co-uttrykk moduler. GraphWeb er designet for å analysere individuelle eller flere fusjonerte nettverk, søke etter konserverte funksjoner på tvers av flere arter, mine store biologiske nettverk for mindre moduler, og sammenligne resultatene av high-throughput datasett. Markov Cluster (MCL) [49] algoritme via GraphWeb verktøyet ble brukt for å beskjære nettverket og for å finne genet moduler. MCL algoritmen simulerer en stokastisk strømning i uttrykket grafen og fjerner kantene som er besøkt sjelden, noe som resulterer i en samling av tett forbundet grupper av gener. Parameteren av Markov clustering parameter ble satt til en standard verdi 1,8.

Kandidaten modulene inneholder DE-gener ble valgt til å vurdere sykdomsrisiko. Neste,

Z

-test [50] ble brukt for å vurdere forholdet mellom individuelle tumorprøver og moduler (figur 2).

Til slutt, de betydelige prøver med Z -Test høyere enn betydningen terskel (α = 0,05) ble plukket ut. For å måle risikoen for hver modul, vi definert:

M

risiko

kan brukes til å vurdere sykdomsrisiko for en kandidat modul. For hver kandidat modul, ble 10.000 tilfeldige moduler konstruert av tilfeldig velge gener fra bakgrunnen genet satt med likt antall modul gener. Deretter

M

risiko

ble beregnet for hver tilfeldig modul, og andelen av moduler med

M

risiko

større enn den reelle verdien (betydningen

p

-verdi) ble beregnet. Moduler med p 0,05 ble betraktet som kreft-risikomoduler

d.. . Evaluering av utvalget sykdom risiko

For å vurdere modulbaserte sykdomsrisiko for hver prøve, vi definert:

hvor M omfatter alle kreftrisikomoduler,

N

er antall kreft-risiko moduler, betyr kreft-risikoen for prøven

i

om modulen

j

, og

p

er betydningen av Z-test.

Cancer-risikomoduler ble anvendt for å evaluere prøvene ved å beregne den modulbaserte sykdomsrisiko for hver prøve. Deretter evaluering ytelse ble anslått av en mottaker som opererer karakteristikk (ROC) kurve.

Resultater

Den svært trygg co-uttrykk nettverk

Pearson korrelasjonskoeffisient og GO semantiske likheten mellom hvert par av gener i ekspresjonsprofilen GSE7670 ble beregnet. Etter dette ble kurvetilpasning brukt til å analysere variasjonen utviklingen av gjennomsnittlig fordeling av ko-ekspresjon verdi med GO semantisk likhet med en 0,05 intervall (figur 3). Funksjonell likheten øke ved samtidig uttrykk nivået var over tangency punktet. Derfor ble parene av gener med funksjonelle likheten mer enn 0,582 og Pearson korrelasjonskoeffisient enn 0,82 (tangentpunktet) som er valgt for å skape den svært trygge koekspresjon nettverk, som besto av 9841 noder og kanter 112,605.

der

μ

betyr at gjennomsnittlig uttrykket verdien av alle gener i module1 for tumorprøve s1; e11 er uttrykk verdien av g1 i module1 for s1, så gjør andre; betyr den gjennomsnittlige verdien av uttrykket alle gener for alle normale prøver; σ er standardavviket for alle normale prøver.

Kreft risiko moduler

Det er totalt 472 DE-gener ble undersøkt ved å anvende BFLn til uttrykket profilen GSE7670. Da 75 kandidatsykdoms moduler som inneholder DE-gener ble innhentet gjennom GraphWeb. Etter den randomiserte testen ble 31 lungekreftrisikomoduler innhentet (Tabell 3).

Evaluering av kreft-risikomoduler

kreft-risikomoduler ble evaluert på funksjonelt nivå og interaksjonistisk nivå. På den ene siden var funksjonelle berikelse utført for hver lungekreft-risiko modul med et nettbasert verktøy DAVID (https://david.abcc.ncifcrf.gov/home.jsp) [51], og betydelig beriket GO form av hver modul ble oppnådd (Flere moduler er i tabell S1). På den annen side ble de interaksjon forhold mellom modulene vurderes ved hjelp av protein interaksjonsdata fra iRefWeb. Forholdet nettverk av kreft-risikomoduler og kjente lungekreft gener ble konstruert på grunnlag av funksjonelle og interaksjons forhold (figur 4). Resultatene viste at lungekreftrisikomoduler var nært beslektet med lungekreftgener, som indikerte at disse modulene og gener kan synergi forårsake lungekreft. For eksempel, ble M46 forbundet med cellesyklusregulering og fosforylering [52], celleproliferasjon og cellesyklus kontrollpunkt [53], og ATP-bindings [54] ved å samhandle med kjente lungekreft gener KRAS, KDR og TP53, respektivt. Disse funksjonene ble bekreftet å være relatert til forekomsten av lungekreft. En annen modul M63 ble betydelig anriket med funksjoner som er forbundet med kreft, f.eks responsen på kortikosteroid stimulans, responsen på organisk stoff, og glukokortikoid stimulans og steroid hormon stimulans sammen ved å samhandle med kjent lungekreftgener KRAS, NFE2L2 og NKX2 henholdsvis [55], [56], [57].

Purple punkt betyr observasjoner, røde linjen viser kurvetilpasning, den stiplede kurven representerer den første bestillingen tangent.

for ytterligere å analysere forholdet nettverk, ble kreftrisikomoduler klassifisert i tre typer etter til risiko: de høye, middels og lave risikomoduler (Tabell 3), og de tilsvarende grad fordelinger ble beregnet (tabell 4). Resultatene viste at den høye risikomoduler har en tendens til å ha høye grader. Nemlig, de hadde flere forbindelser med andre moduler og kjente sykdomsgener ved de funksjonelle og interaksjon nivåer. De spilte sentrale roller i nettverket.

Evaluering av modulbaserte sykdomsrisiko

Den kreftrisiko for hver prøve lunge ble evaluert ved å vurdere kreftrisikomoduler. Ved å måle risikoen for lungekreft (

S

risiko

), hver prøve i GSE7670 ble evaluert. Det viste seg at hver prøve kan være vellykket identifisert som sykdom (

S

risiko

0,8) eller normal (

S

risiko

0,8) basert på sin sykdom risiko (figur 5).

sirklene indikerer kreft-risiko moduler, og andelen oransje deler indikerer kreftrisiko (

M

risiko

). Sykdomsfremkallende gener er representert med røde trekanter. Kanter «farge indikerer forholdet, lilla representerer for protein-protein interaksjon, grønn for funksjon deling, og rødt for både funksjonell og samhandling forhold.

Robustheten vår metode

for å verifisere robusthet av denne metoden, først, fire andre uttrykk profiler (GSE10072 fra GPL96, det samme som GSE7670, GSE27262 og GSE40791 fra GPL570, og GSE21933 fra GPL6254) om lungekreft og normal ble evaluert, henholdsvis (tabell 1) . Resultatene viste at de modulbaserte sykdoms risikoen for kreftprøvene var høyere enn de i vanlig seg (figur 6A). ROC-kurver ble deretter plottet, og AUC-verdiene ( 0,97) ble anvendt for å måle de evaluerings forestillinger av kreft-risikomoduler som ble oppnådd ved vår metode (figur 6c). Metoden hadde god ytelse i uttrykket profilene ikke bare fra samme plattform, men også fra ulike plattformer.

X-aksen er prøver. Y-aksen er risikoen for lungekreft score på enkeltprøver, og det er rangert fra minst til størst. Red representerer lungekreft prøver; og blå representerer normale prøver.

Neste, vi identifiserte risikomoduler av leverkreft (GSE14520), tykktarmskreft (GSE15781), brystkreft (GSE20437), og prostatakreft (GSE26126) på samme måte henholdsvis (Mer kreft-risiko moduler informasjon i de fire kreft er i tabell S3). De kreftrisikomoduler ble brukt for å vurdere sykdomsrisiko av prøvene, og de tilsvarende ROC-kurver ble trukket (figur 7).

a) X-aksen er prøver. Y-aksen er risikoen for lungekreft score på enkelte prøver å bruke vår metode, og det er rangert fra de minste til de største. Blå representerer GSE10072; grønn representerer GSE21933; rød representerer GSE27262; og brun representerer GSE4079. Full linjene representerer lungekreft prøver; og stiplede linjer representerer normale prøver. De ulike eksperiment datasett har forskjellig antall normale prøver og sykdoms prøvene. For å vise den sykdomsrisiko for hver prøve i fire ekspresjonsprofiler intuitivt, blir alle prøver av hver ekspresjonsprofiler jevnt fordelt over hele x-aksen. b) Figuren er opptegnet på samme måte som a). Den lungekreft av hver prøve ble bedømt ved den WGCNA metode. c) Mottaker operatør karakteristikk bruke vår metode for de fire lungekreft uttrykksprofiler (se figur 7a). Arealene under kurven gitt nederst til høyre for hvert diagram. d) Receiver operatør karakteristikk bruker WGCNA metode for fire lungekreft uttrykk profiler (se figur 7b).

Metode sammenligninger

WGCNA metoden [24] er et mye brukt teknikk for å konstruere genet moduler innenfor et nettverk basert på gene expression co-relasjoner. I denne utredningen, ble nøyaktigheten og robustheten WGCNA og vår metode sammenlignet. Femti syv lungekreftrisikomoduler ble hentet fra GSE7670 bruker WGCNA metoden. Den risikoen for lungekreft for hver prøve i GSE7670 selv ble evaluert med modulene. Kreft risiko for enkelte kreftprøver var mindre enn de normale sortene (figur 8), noe som indikerte WGCNA metoden kan ikke helt identifisert prøvene som sykdom eller normal så nøyaktig, mens vår metode kunne (figur 5).

Da evaluering av prøvene «lungekreftrisiko ble utvidet til andre fire ekspresjonsprofiler ca. lungekreft og normal (figur 6b). Det ble funnet at kreft risikoen for kreft prøvene var ikke signifikant forskjellig fra normale. ROC-kurver ble deretter brukt til å evaluere resultatene av WGCNA metode (figur 6d). Vi fant ut at vår metode hadde bedre nøyaktighet og robusthet enn WGCNA metode (figur 6).

Diskusjoner

Å studere mekanismene for sykdommer ved å analysere genuttrykk profiler ser ut til å være en praktisk og effektiv måte . Tatt i betraktning den funksjonelle likheten kunne bedre reflektere den funksjon informasjonen av sykdommen. I denne utredningen, ble en ny metode foreslått å identifisere tretti en kreft-risikomoduler og vurdere modulbaserte sykdomsrisiko av prøver ved hjelp av en co-uttrykk nettverk med funksjonelle likheten informasjon. Til slutt ble forholdet nettverk av kreft-risiko moduler og kreftgener bygget på funksjonsnivå og interaksjonistisk nivå.

Disse modulene ble funnet å være nært knyttet til kreft i aspekter av funksjoner, samspill og litteratur. Vår metode ble vist seg å være ganske robust ved å evaluere sykdoms risikoen ved prøver i fire lungekreft uttrykk profiler og fire andre kreftformer, og hadde bedre ytelse enn WGCNA metoden.

Kreft risiko moduler og evaluering av den modulbaserte sykdomsrisiko fra denne studien ble bekreftet å være troverdig med følgende betraktninger. (I) differensielt uttrykte gener ble utvalgt ved hjelp av BFLn metoden, som betraktet både genekspresjon og prøven etikett fordeling for derved å eliminere utliggere som følge av forspenningen ekspresjon av individuelle genet eller eksperimentfeil. (Ii) Vår genet nettverk var av høy tillit, fordi metoden ble brukt til å beregne ikke bare co-uttrykk sammenheng, men også funksjonelle likheter mellom gener. Genet parene med både høy uttrykk konsistens og funksjonelle likheten ble beholdt for å bygge den høye trygg nettverket, som var i stand til å unngå partisk resultater bare avhengig av uttrykk. (Iii) kreftrisiko av moduler ble evaluert ved å bruke andelen av betydelige tumorprøver, som kan være en ny metode for å evaluere sykdoms moduler. Genene i kreftrisikomoduler kan være potensielle sykdomsgener, og kan fungere som narkotika mål for behandling av aggressiv kreft. Alle gener av M46 var knyttet til lungekreft. For eksempel, er MCM7 en betydelig subenhet av MCM-komplekset, som kan være en ny terapeutisk mål for kreft i lunge [58]. Et annet gen BARD1, hvis isoformer kan være relatert til tumor initiering og progresjon invasiv, var et mer egnet neoteric prognostisk markør for ikke-små-celle lungekreft [59]. KIF4A kan holde et løfte for utvikling av kreft narkotika og kreftvaksiner samt en prognostisk biomarkør i klinikken [60]. For genene i modul M63, A2M var i begrenset og utvidet lungekreftpasienter sammenlignet med en nonsmoker og røyker kontroll befolkningen [61], FABP4 ble nedregulert i lunge adenokarsinom [62], og CASP1 påvirket single-nukleotid polymorfismer, øker den kreftrisikoen [63]. (Iv) Evalueringen av samples «modulbaserte sykdomsrisiko er nøyaktighet og robusthet. Fordi vår metode integrert de differensielt uttrykte gener, en co-uttrykk nettverk og funksjonelle likheter, ble kreftrisikomoduler nært knyttet til patogenesen av kreft i aspekter av funksjoner og interaksjoner. På funksjonsnivå, kan de kreftrisikomoduler reflektere de funksjonelle klasser knyttet til sykdommer; på interactional nivå, kunne kreft-risikomoduler være meget høyt korrelert med sykdomsgener.

I tillegg undersøkte vi overlappingen mellom de kreft-risiko moduler og proteinforbindelser (figur 9). Resultatene av geometriske distribusjonen analyse viste at 17 moduler hadde betydelig overlapping med 150 komplekser (p 0,05). For eksempel, modul M46 delt gener med 24 komplekser, blant disse 19 komplekser hadde en overlapping som er høyere enn 20%. Komplekset BRCA1_A rekruttert BRCA1 til DNA-skadesteder [64]. Delvis uttømming av MCM proteiner som ble vanligvis lagt i overdreven antall steder ført til kreft og stamcelle mangler [65]. Uttrykket av ubiquitin E3 ligase ble forbundet med østrogen reseptor (ER) -positivt status i humane brystsvulster [66] (flere moduler og kompleks informasjon er i tabellen S2). Vår metode vil være mer omfattende vurderer protein-protein informasjon til å konstruere et integrert nettverk og utvikle en modul gruvedrift algoritme i fremtiden.

Sirklene indikerer kreft-risiko moduler, og andelen oransje deler indikerer kreftrisiko (

M

risiko

). De grønne firkantene angir komplekser. Kanter indikere kreft-risikomoduler og komplekser dele minst ett gen. Jo flere antall av felles gener er, jo rødere kantene er.

I konklusjonen, denne studien presentert en ny metode for å evaluere sykdomsrisiko av prøver basert på kreft-risiko moduler og å analysere relasjoner mellom sykdommen og moduler. Denne metoden kan gi hjelp til diagnostisering og behandling av kreft og en ny ledetråd for å avsløre kreftmekanismer.

Hjelpemiddel Informasjon

Tabell S1.

GO informasjon om kreft-risiko moduler

doi:. 10,1371 /journal.pone.0092395.s001 plakater (DOC)

Tabell S2.

Cancer-risikomoduler og kompleksets

doi:. 10,1371 /journal.pone.0092395.s002 plakater (DOC)

tabell S3. Bedrifter Den kreftrisikomoduler i de andre fire kreft

doi:. 10,1371 /journal.pone.0092395.s003 plakater (DOC)

Legg att eit svar