Abstract
Samler bevis viser en tett kobling mellom betennelse og kreft. Men omfattende identifisering av sentrale transkripsjonsfaktorer (dvs. kjernen TFS) formidling av feilregulert koblinger er fortsatt utfordrende, hovedsakelig på grunn av mangel på prøver som effektivt kan reflektere sammenhengen mellom betennelse og tumorigenesis. Her, bygget vi en serie med TF-mediert regulatoriske nettverk fra en stor samling av uttrykk profilering av normale colonic vev, inflammatoriske tarmsykdommer (IBDs) og tykktarmskreft (CRC), som inneholder 1201 prøver totalt, og deretter foreslått en nettverks basert tilnærming for å karakterisere mulige koblinger bygge bro betennelse og kreft. For dette formål, beregnet vi betydelig feilregulert forhold mellom inflammasjon og deres tilknyttede kreft nettverk, og deretter 24 kjerne TFS med tilhørende feilregulert gener ble identifisert. Samlet gir vår tilnærming oss med ganske viktig innsikt i betennelse-assosiert tumorigenesis i tykktarmskreft, som også kan brukes til å identifisere funksjonelt feilregulert relasjoner medierer sammenhengen mellom andre ulike sykdoms fenotyper
Citation. Xiao Y, Fan H, Zhang Y, Xing W, Ping Y, Zhao H, et al. (2013) Systematisk Identifikasjon av kjernetranskripsjonsfaktorer medierfeilregulert Lenker Bridging inflammatoriske tarmsykdommer og tykktarmskreft. PLoS ONE 8 (12): e83495. doi: 10,1371 /journal.pone.0083495
Redaktør: Paolo Provero, Universitetet i Torino, Italia
mottatt: 9 juli 2013; Godkjent: 04.11.2013; Publisert: 26.12.2013
Copyright: © 2013 Xiao et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet delvis av de kreative Forskningsgrupper grupper~~POS=HEADCOMP av The National Natural Science Foundation of China (tilskuddsnummer 81121003, 91129710, 91029717, 91229112 og 31200997), Specialized forskningsfond for doktorgradsutdanning av høyere utdanning i Kina (tilskudd nummer 20102307110022), Foundation vitenskapen om Heilongjiang-provinsen (tilskuddsordninger tall D200834 og C201207) og Foundation Science of Heilongjiang-provinsen undervisningsavdeling (tilskudd nummer YJSCX2012-230HLJ). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
den nære koblingen mellom betennelse og kreft i tarmen har blitt verdsatt i århundrer basert på kliniske observasjoner [1], [2]. Inflammatoriske tarmsykdommer (IBDs), som omfatter ulcerøs kolitt (UC) og Crohns sykdom (CD), predisponere for å utvikle kolorektal kreft (CRC) [3], som er en av de mest vanlige og alvorlige krefttyper over hele verden. Selv om «adenom-karsinom-sekvensen har vært lang sentralt for studier på CRC, har et skifte i fokus til sekvensen av «betennelse-dysplasi-karsinom» blitt observert [4]. En mulig forklaring [5], [6] kan være at betennelse, som påskynder oppkjøpet av kreft kjennetegnene til grunn for de skadde colonic vev, kan fremme tumorigen progresjon. Imidlertid tolkning av de tette koblinger brodannende betennelse og kreft i tarmen fortsatt vanskelige.
High-throughput-teknologi har i stor grad fremmet produksjonen av store mengder av flerlags biologiske data, for eksempel genekspresjon mikromatriser [7] , [8]; Disse data er i stor utstrekning brukt for å karakterisere de molekylære forskjeller mellom normale og maligne celler [9], [10], eller molekyl assosiasjoner mellom forskjellige sykdoms fenotyper [11], for eksempel betennelse og kreft. Disse uttrykk baserte studier vellykket identifisert enkelte gener involvert i fenotypisk karakterisering, mens det er fortsatt vanskelig å antyde noen detaljer om relasjoner mellom disse molekylene underliggende onkogenese. Derfor er det rimelig å identifisere relasjoner endret eller feilregulert på en sti eller nettverksnivå.
Mye av en celle respons på det indre og ytre stimuli er styrt av en global regulatoriske nettverk hovedsakelig på transkripsjonsnivået [12] . Som en av de store regulatorer i pattedyr cellulær sammenheng, transkripsjonsfaktorer (TFS) i betydelig grad bidrar til en rekke patologiske prosesser. Greten et al. [13] viste at den angitte komponenten av transkripsjonsfaktor
NF-kB
knyttet betennelse og tumorigenesis i UC-relaterte CRC, ved hjelp av en knockout mus modell. En fersk arbeid [14] innblandet transkripsjonsfaktor
STAT3
i celle overlevelse og cellesyklusprogresjon av kolitt-assosiert tumorigenesis. Imidlertid har ingen systematiske studier av TFS involvert i linken i tarmen er rapportert. Sette genom-wide uttrykk data i nettverk kunnskap er avgjørende for videre storskala analyse, som krever dataverktøy, for eksempel koekspresjon eller informasjonsteoretisk tilhørende tilnærminger [15]. Nå nylig, er genet nettverk vanligvis konstruert av genuttrykk data gjennom beregningsanalyse. Den første storskala analyse av microarray koekspresjon mål å øke den slutning stabiliteten av genet funksjoner [16]. Deretter Choi et al. [17] mot en tumor og normal koekspresjon nettverk konstruert fra 13 forskjellige cancer fenotyper, og deretter identifisert differensial koekspresjon forbindelser med funksjonelle forandringer. I tillegg til studier på disse endrede relasjoner, er knyttet trasé eller delnettverk også identifisert via integrerte nettverksbaserte tilnærminger. I tilfelle av glioblastoma (GBM), Cerami et al. [18] bekreftet at funksjonelle GBM endringer tendens til å skje innen spesifikke moduler, og derfor forsøkte de å identifisere GBM-relaterte kjerne trasé ved hjelp av automatiserte nettverksanalyse. Samtidig ble funksjonelle undernettverk i kolorektal kreft anerkjent av Nibbe et al. [19] med random walk algoritme. Utvilsomt disse metodene er nyttige for å identifisere tilhørende molekylære mekanismene bak enkelte sykdom. Men studier om sykdommen fenotype som svar på molekylære forstyrrelser [20] eller på molekylære sammenhenger mellom ulike sykdoms fenotyper er fortsatt i tidlig fase. Abdollahi et al. [21] har vist at overgangen fra angiogene balanse til en pro-angiogen fenotype er styrt av de globale transkripsjonelle kretser i kreft i bukspyttkjertelen som reaksjon på nøkkel endogene proteiner, på grunnlag av et reguleringsnettverk. En annen studie på forskjellige stadier av hepatokarsinom gjennomført av He et al. [22] identifisert potensielle molekylære prosesser ved å anvende et nettverk tilnærming i kombinasjon med transkripsjonsregulering
I dette arbeidet har vi adoptert en integrert beregningsmetoden (figur 1, jf. Også fig S1 for et flytskjema over de beregningstrinn ) for å rekonstruere regulatoriske nettverk av normal, IBDs og CRC fra en stor samling av genekspresjon profilering med forskjellige uttrykk mønstre av inflammasjon og kreftgener (betegnet som IC-spesifikke nettverk), ved hjelp av en omvendt-engineering algoritme. En nettverksbasert gruppering blir så tilført for å karakterisere en potensiell anelse bindings IBDs og tilhørende CRC-nettverk, som hjelper oss å skille inflammatoriske nettverk med tumorigene potensialer. Gjennom nettverket sammenligning analyse, er feilregulert relasjoner beregnet med betydelig gevinst eller tap av gjensidig informasjon mellom betennelse og kreft nettverk, og deretter en feilregulert nettverket er konstruert. Basert på feilregulert mønster analyse, vi endelig identifisere 24 sentrale TFS (dvs. kjernen TFS), sammen med sine feilregulert gener, som interessante kandidater for biologer; dette vil sikkert utvide og komplettere nåværende kunnskap betennelse-relaterte tumorigenesis ved kolorektalkreft
Prosedyren er i hovedsak delt inn i fire trinn:. 1) rekonstruksjon av IC-spesifikke regulatoriske nettverk fra en stor samling av microarray data; 2) clustering av IC-spesifikke regulatoriske nettverk ved hjelp av nettverks TOM, etterfulgt av nettverks forstyrrelser; 3) bygging av en feilregulert nettverk med kanter feilregulert mellom betennelse og deres knyttet kreft nettverk basert på nettverks sammenligninger; 4) identifisering av kjerne TFS via feilregulert mønster analyse. TF, transkripsjonsfaktor; Ig, betennelse genet; Cg, kolorektal kreft genet; MI, gjensidig informasjon.
Materialer og metoder
Datakilder
Vi samlet 13 IBDs og CRC-relaterte genekspresjon datasett fra Gene Expression Omnibus (GEO) (tabell S1). Deres tilsvarende bearbeidet serien matrise filer ble brukt som inndata for å re-konstruere genet interaksjon nettverk. Bakgrunnskorreksjon og data normalisering av hvert uttrykk datasett ble allerede utført, separat. Probe sett kartlagt stykke eller flere menneskelige genet IDer ble fjernet. Expression verdier ble log2 forvandlet. For hvert datasett, hentet vi prøver i forhold til UC, CD, CRC, og normal, noe som resulterte i 22 uttrykk datasett.
Vi har fått 231 inflammasjonsrelaterte gener fra Gene Ontologi kategoriene «betennelsesreaksjon» (GO: 0006954) og «regulering av inflammatorisk respons» (GO: 0050727), som så ble referert til som betennelse genet sett. Den kolorektal kreft genet sett (kreft genet sett), som omfattet 196 gener, ble manuelt generert fra omim database (OMIM) ved å søke ulike stikkord ( «colorectal cancer» OR «tykktarmskreft» OR «kolorektal svulst» ). Disse to gensettene blir så omtalt som IC gensettene. Dessuten, en TF sett henviser til 344 unike TFS ble lastet ned fra TRANSFAC® Professional 11.4.
Rekonstruer IC-spesifikke regulatoriske nettverk
Først, k-means algoritmen [23] ble brukt til IBD og CRC-relaterte uttrykk datasett basert på uttrykk mønstre av gener i både betennelse og kreft gensettene, identifisere uttrykk-homogen utvalgsgrupper som deretter ble kalt IC-spesifikke datasett. For hver av de UC, CD, og CRC relaterte datasett med mer enn 100 prøver, gruppert vi prøver i fire klynger ved hjelp av k-means. De med mindre enn 100 prøver ble gruppert i to klynger. Den deles uttrykk profilering eller IC-spesifikke uttrykk datasett, inkludert normal datasettene ikke utsettes for clustering behandling, ble generert. Deretter ble de med mindre enn 20 prøver utelukket fra videre studier, i betraktning av nøyaktigheten av den metode som brukes for konstruksjon av regulatoriske nettverk [24]. Datasettene ikke utelukkes ble brukt for gjenoppbyggingen av IC-spesifikke regulatoriske nettverk.
ARACNe (Algoritme for Rekonstruksjon av Nøyaktige Cellular Networks) [25], som er basert på et informasjonsteoretisk tilnærming og databehandling ulikhet (DPI) kontroll, gir en måte å antyde regulatoriske nettverk direkte fra genuttrykk data. Interaksjoner mellom TFS og gener ble identifisert ved å beregne gjensidig informasjon (MI) beregnet ved Gauss kjernen metoden med en spesifisert
p-
verdi cutoff, som så ble beskåret av DPI-analyse basert på en toleranse parameter. Basert på TF sett hentet fra TRANSFAC, brukte vi ARACNe program for å rekonstruere en regulatorisk nettverk mellom TFS og alle gener som oppdages av microarray screening av hver IC-spesifikke uttrykk datasett selvstendig, med en
p-
verdi cutoff på 0.001 og en streng cutoff på DPI toleranse på 0%. Så valgte vi ut IC og TF gener fra den konstruerte regulatoriske nettverk, som er betegnet som IC-spesifikke regulatoriske nettverk.
Clustering av IC-spesifikke regulatoriske nettverk
En modifisert versjon av topologisk overlapping tiltaket ( TOM) [26], [27] som heter nettverk TOM ble foreslått å beregne likheten av regulatoriske egenskaper for alle vanlige TFS mellom hver to regulatoriske nettverk, når du utfører gruppering av IC-spesifikke nettverk. Gitt to regulatoriske nettverk, la og være antall naboer av vanlig i og henholdsvis. Antall vanlige naboer av var representert ved, og da kunne vi definere for noen felles som følger:
Til slutt ble summert opp nettverk mellom de to nettverkene, og deretter delt på maksimal nettverks TOM for alle mulige parvise nettverk, som deretter ble brukt som mål på likheten mellom de to nettverkene.
deretter nettverks permutasjoner ble brukt til disse IC-spesifikke nettverk og deretter nye clustering resultater ble generert via gjentatte ganger å fjerne ett nettverk for hele nett som anvendes til nettverket clustering og deretter to nettverk ut, ved hjelp av den samme likheten tiltaket.
Computing feilregulert relasjoner
Vi definerer en regulatorisk sammenheng mellom og å bli dysregulerte mellom betennelse og kreft nettverk, hvis og bare hvis MI forskjellen i forholdet mellom IBD og CRC-nettverk er statistisk signifikant sammenlignet med tilfeldig fordeling.
Gitt et par av IBD og CRC-nettverk, i kombinasjon vi de tilstøtende naboer for hver felles i de enkelte nettverk og så beregnet MI forskjell for hver relasjon av alle vanlige TFS. MI forskjellen mellom og ble beregnet som følger: hvor og representerer MI mellom og i CRC og IBD nettverk, henholdsvis. Alle MI-verdier ble beregnet fra det ARACNe program. Til slutt, genererte vi alle MI forskjeller for alle relasjoner av alle vanlige TFS mellom de to nettverkene. For å identifisere feilregulert forhold, ble permutasjon tester utført 100 ganger for begge IBD og CRC uttrykk datasett, noe som resulterer i 100 par tilfeldige nettverk beregnet fra de tilsvarende par av tilfeldige datasett. Vi gjentatte ganger beregnet MI forskjell for hvert forhold med hvert par av tilfeldige IBD og CRC nettverk oppnådd ovenfor, og deretter slått sammen alle MI forskjeller inn i en tilfeldig fordeling. En falsk funnrate (FDR)
p-
verdi 0,05 ble brukt som betydning cutoff. Disse feilregulert relasjoner ble visualisert ved hjelp Cytoscape programvare [28]. Den største sammenhengende komponent ble ekstrahert for videre analyse.
Identifisere Kjernetranskripsjonsfaktorer
En TF er definert til å være en sentral regulator i feilregulert nettverk bygget ut av feilregulert relasjoner mellom IBD og CRC-nettverk, basert på grad fordelingen av TF og forholdstall sammensetningen av direkte tilkoblede betennelser og kreftgener. Når det gjelder forholdene sammensetningen av hver TF, beregnet vi at forholdet mellom antallet av tilstøtende inflammasjons gener til dens grad, og at forholdet mellom antallet av tilstøtende kreftgener til dens grad.
Resultatene
Rekonstruksjon av IC-spesifikke Normal, IBD, og CRC Regulatory Networks
Vi har samlet tolv genuttrykk datasett fra GEO databasen (tabell S1). Ut fra disse dataene, hentet vi 22 sett med normal, UC, CD, og CRC uttrykk data (normal: 7, UC: 6, CD: 3; CRC: 6) henviser til 1201 prøver totalt. For det første, for å generere relativt homogene prøver, søkte vi et k-means algoritmen til 22 uttrykk datasett basert på de forskjellige uttrykk mønstre av 196 kreft og 231 betennelse gener. Dette resulterte i 14 UC, 6-CD, og 16 CRC undergrupper, som er referert til som IC-spesifikke. De øvrige 7 normale datasett, som ikke ble utsatt for k-means analyse, antas homogen og også inkludert for videre analyse. Til slutt ble tjueen IC-spesifikke ekspresjon datasett bevart, inkludert 5 UC, 2-CD, 11 CRC, og 3 normal, med minst 20 prøver for hvert.
Deretter rekonstruert vi 21 IC-spesifikt regulatoriske nettverk fra de tilsvarende IC-spesifikke ekspresjon datasett ved å bruke ARACNe program med en P-verdi og en DPI toleranse som beskrevet i Materialer og Metoder. ARACNe, som en omvendt-engineering algoritme, er mye brukt til å rekonstruere genet samhandlingsnettverk i pattedyrcelle sammenheng. Som sammenligne med andre algoritmer i samme familie, er ARACNe algoritme anses god i ytelse når du arbeider med steady-state data (ikke tidsserien), og er fortsatt utestående når noen eksperimenter er tilgjengelige, sammenlignet med antall gener [29] , [30], [31]. Antatt nettverk inneholdt TFS og alle deres potensielt koblet gener. For ytterligere å utforske de underliggende dreie faktorer som medierer de feilregulert forbindelser, ble TFS og deres direkte koblet IC gener ekstrahert, og da den maksimale tilkoblet komponent for hver IC-spesifikt nettverk ble anvendt for den følgende analyse (figur S2).
Figur 2 viser den nettverks topologiske parametere av 21 IC-spesifikke nettverk, inkludert nettverk diameter, nettverk tetthet, mener node nærhet, mener node korteste stier, betweenness, og grad. Nettverks konstitusjoner, dvs. antallet TF, betennelser gener og kreftgener som svarer til hvert nettverk er også tilveiebrakt. Vi ser at knutepunktene er dannet på samme måte mellom nettverkene. Antallet TFS, betennelse eller kreftgener i hvert nettverk viser små forandringer, som strekker 288-339, 212-225 og 170-174, respektivt. Dessuten er de respektive antall node konstitusjoner for vanlige TFS, betennelse eller kreft gener mellom hver to IC-spesifikke nettverk også parallelt med hverandre (detaljer i Figur S3). Men visse topologiske parametere viser åpen discordances blant normal, betennelse eller kreft regulatoriske nettverk. For eksempel, mener node (bare TFS) og kanten (alle kanter) betweenness viser store forskjeller med hverandre, selv blant kreft nettverk selv. Mens gjennomsnitts node (bare TFS) nærhet og korteste stier viser moderate forskjeller når betennelse og kreft nettverk er sammenlignet.
De respektive antall TFS, betennelser og kreftgener er oppført i de tre første kolonnene. Network diameter, nettverk tetthet, mener node nærhet (bare TFS), mener nodekorteste baner (bare TFS), og mener betweenness av noder (bare TFS) og kanter (alle kanter) er også inkludert i de følgende seks kolonner. For de ni første kolonnene er hver sammen med et histogram utenfor den første raden, med høyden på hver linje som angir antallet i hver celle av den tilsvarende kolonne. Graden fordeling av bare TF’er i hvert nettverk er gitt som histogrammer i den siste kolonnen. De tre svarte ned-pilene i hvert histogram klassifisere alle barer i fire grupper, som representerer kreft, CD, normal, og UC nettverk, henholdsvis. InGene, betennelse genet; CaGene, kreft genet; #, Antall; NodeCn, node nærhet; NodeSp, node korteste stier; NodeBt, node betweenness; EdgeBt, edge betweenness.
En Potential Clue Linking IBDs og Associated CRC
Nettverk TOM brukes til å vurdere den regulatoriske likheten av felles TFS mellom hver to forskjellige nettverk. Vi deretter brukt nettverket likheten tiltaket å klynge 21 IC-spesifikke regulatoriske nettverk. Som indikert ved den clustering resultat av normale, betennelser eller kreftnett generelt ha maksimal likhet innenfor sine respektive kategorier, for eksempel den grenen av åtte tett grupperte kreft nettverk som er vist i figur 3 (til venstre for den røde stiplete linje). Akkurat, er det nærliggende grenen av fem betennelse (inkludert CD og UC), og to normale nettverk også tett gruppert henholdsvis. Disse nettverkene forventes å gi de mest nært knyttet regulatoriske mønstre av TFS utgjør tre store representative grener av normal, betennelse og kreft (fra høyre til venstre, merket med tilsvarende farge skygge i figur 3). Hver gren betyr at disse nettverkene er mye mer parallelt med hverandre i reguleringsmekanismer (eller regulerende mønstre) enn med de fra andre grener. Intuitionistically er to vanlige nettverk gruppert innenfor den grenen av betennelse nettverk, som vi kalte det normale gren; deres bemerkelsesverdig mindre avstanden er faktisk en god representasjon for den høye ytelsen til våre foreslåtte nettverk TOM. Ikke overraskende, de tett gruppert betennelse eller kreft nettverk generert relativt større avstand er hovedsakelig på grunn av sykdom heterogenitet [32].
Nettverk TOM ble brukt som likheten mål på hierarkisk clustering. Tre representative grener er merket med annen farge skygge. Ca, kreft nettverk; UC og CD, betennelse nettverk; Normal, normal nettverk; Ca.GSE25070_24.network, kreft nettverk utledes fra GSE25070 datasett med 24 prøver etter utsette til k-means algoritmen.
Interessant, to UC nettverk, dvs. UC.GSE3629_22.network og UC.GSE3629_31.network, er gruppert tett sammen med en CRC-nettverk, dvs. Ca.GSE13294_42.network, i den høyre gren (figur 3, høyre av den røde stiplete linje). Ved systematisk støy, prøvde vi å evaluere gjentakelse av den eksakte gren ved tilfeldig fjerne en nettverks ut og deretter utføre clustering på de resterende nettverk. Selv om forstyrrelser av nettverk som brukes for clustering kan føre til noen endringer i resultatene, blir vi oppfordret til å se at de to UC nettverk er alltid gruppert med samme CRC nettverk (figur 4). Konsekvent, resultatene for tilfeldig fjerning av to nettverk ut viser også at den eksakte gren gjentar seg med de mest frekvens. Videre, som støttes av litteraturen, pasienter med UC er predisponert for kolitt-assosiert kreft (CAC), for eksempel CRC [33], og CRC er en stor trussel i langvarige UC-pasienter [34], som delvis understøtter potensielle linker som følger av den grenen. Vi resonnere slik at det finnes noen lignende reguleringsmekanismer mellom betennelse og kreft regulatoriske nettverk, som også antyder en mulig funksjonell kobling mellom UC og CRC. I mellomtiden, en normal nettverk (Normal.GSE8671_32.network) virket også uventet gruppert innenfor den samme gren ved siden av kreft nettverket. En mulig forklaring kan være at normal nettverket avledet fra histologiske normale colonic vev har allerede utført avanserte molekylære prosesser av inflammasjon og /eller kreft under normal presentasjon (figur S4).
Vi har fjernet ett nettverk ut og deretter genereres ny gruppering, gjentatte ganger, for å undersøke om de grenene som genereres ved hjelp av alle nett tilbakefall eller ikke. (Navnene på de demon nettverk er oppført i første kolonne. Tallet 1 i hver celle fra kolonne to til seks midler tilbakevendende, mens tallet 0 betyr ikke.). Grener klassifisert som CaBranch1, CaBranch2, InBranch, NorBranch, ICBranch og NewBranch manuelt hentet fra hierarkisk clustering bruker alle nettverk. CaBranch1, inneholder nøyaktig de to nettverkene Ca.GSE25070_24.network og Ca.GSE3629_67.network. CaBranch2, inneholder kreft nettverk gruppert tett med hverandre. InBranch inkluderer betennelse nettverk. NorBranch, inneholder nøyaktig de to vanlige nettverk av Normal.GSE11223_63.network og Normal.GSE20881_67.network. ICBranch, inneholder nøyaktig de fire nettverkene av UC.GSE3629_22.network, UC.GSE3629_31.network, Ca.GSE13294_42.network og Normal.GSE8671_32.network. NewBranch ble vist på høyre side, og kun hvis ICBranch manglet. UC nettverk i ICBranch er understreket av røde linjen i NewBranch.
feilregulert Relasjoner mellom UC og deres eksterne CRC
Clustering av IC-spesifikke regulatoriske nettverk basert på nettverket TOM hjelper oss til avgrense en potensiell ledetråd bindings UC og tilhørende CRC med den gren (figur 3, høyre av rød stiplet linje) tilveie oss ganske lovende kandidater. Å tolke feilregulert linker, ble relasjoner med betydelig gevinst eller tap av MI mellom UC og CRC-nettverk identifiseres. For kombinasjonen av UC.GSE3629_22.network og Ca.GSE13294_42.network, vi først kombinert direkte naboer av felles TFS, og deretter beregnet MI forskjell for hver relasjon. For det andre, 100 tilfeldige IC-spesifikk ekspresjon datasett for hver av de to uttrykk datasettene, som ble brukt til å rekonstruere korresponderende regulatoriske nettverk, ble samlet. Fra hver av de 100 pair tilfeldig uttrykk datasett, vi gjentatte ganger beregnet MI forskjeller for de forhold som er beregnet ovenfor, etter å rekonstruere svarende tilfeldige regulatoriske nettverk som bruker ARACNe program med standardparametre, og deretter danner en tilfeldig fordeling av MI forskjeller. I sammenligning med tilfeldig fordeling, kan vi definere betydningen av hver relasjon med en FDR p-verdi 0,05. Disse relasjonene med betydelig gevinst eller tap av MI ble ansett som dysregulerte. Deretter genereres vi 3394 feilregulert relasjoner fra kombinasjonen, mens 2898 ble samlet inn den andre kombinasjonen av UC.GSE3629_31.network og Ca.GSE13294_42.network. Til slutt hentet vi 1052 relasjoner, som ble definert som dysregulerte samtidig i begge kombinasjoner, for å konstruere en feilregulert nettverk.
Nettverket, som inneholder 625 noder med 285 TFS, og 200 betennelse og 162 kreftgener, er en Målet representasjon av 1052 feilregulert relasjoner mellom TFS og IC gener. Key nettverks topologiske parametere (figur S5) viser at det er en skala-fri og små-verden biologisk nettverk.
Kjernetranskripsjonsfaktorer megle feilregulert Lenker
transkripsjonsfaktor-medierte regulatoriske nettverk tjene som et beslutningssystem innen pattedyrceller [35]. Derfor, basert på feilregulert nettverk konstruert, kan vi identifisere kjerne TFS fungerer gjennom å regulere tilstøtende feilregulert gener bygge bro UC og tilhørende CRC. Etter å ha studert grad distribusjon av alle TF’er i nettverket, vi terskel et TF grad på ikke mindre enn 8 for å være topologisk viktig. Og så, sjekket vi sammensetningen forholdet mellom tilstøtende betennelser og kreftgener i alle TFS. Som indikert, kan TFS kategoriseres i tre typer: cancerogenic TFS med stort sett tilstøtende kreftgener; inflammatorisk TFS med det meste tilstøtende betennelse gener; IC-spesifikke TFS med både tilstøtende betennelser og kreftgener. For å kunne identifisere de potensielt involverte kjerne TFS som regulerer ikke bare inflammasjon gener, men også kreftgener, ble forholdstall for sammensetning (inkludert både forholdet mellom antall tilstøtende betennelse, og forholdet mellom antallet av tilstøtende kreftgener) angitt som ved minst 0,1. I favør av våre regler, er 24 kjerne TFS generert basert på disse restriksjonene, vurderer både graden begrensning og konstituerende forholdet mellom deres tilstøtende betennelser og kreftgener. De utsatt for å regulere bare betennelse eller kreft gener og med lavere grad viser en relativ liten påvirkning på hele nettverket strukturen ble ikke inkludert. En feilregulert sub-nettverk (kjernenett) blir så konstruert ut fra 24 kjernen TFS med sine direkte koblet gener (figur 5). Kjernen TF listen inneholder
STAT3
,
GFI1
,
NFATC1
,
TCF7L2
,
ETS1
,
CEBPG
,
XBP1
,
RUNX3
,
SMAD7
,
SMAD2
,
POU2F2
,
FOXC1
TCF4
,
PBX1
,
HOXA4
,
SOX10
,
SREBF1
,
NFYB
,
FOXO1
,
PRDM1
,
ZNF589
,
BACH2
,
POU5F1B
, og
TFF3
. Noen kjerne TFS, dvs.
TCF7L2 Hotell og
FOXO1
er viktig som også retter seg mot for genetiske mutasjoner [36] (figur 5).
Under nettverket er konstruert fra 24 kjerne TFS og deres feilregulert IC gener. Flere interaksjoner har blitt bekreftet av andre forskere. For eksempel samspillet mellom NFATC1 og IL6, og STAT3 og akt1, som har blitt bekreftet av biologiske eksperimenter, er illustrert ved den stiplede rektangelet to satt og tilbys med detaljert informasjon om hvordan det fungerer. Kjerne TFS er uthevet i rødt med større størrelse. Gener med genetiske variasjoner som tilbys av mars et al. er merket med en liten femkantet stjerne.
Enkelte kjerne TFS sammen med sine feilregulert relasjoner er allment kjent, som fremhever viktigheten i reguleringen av kjerne TFS i å bygge bro betennelse og kreft i tarmen. Et eksempel er
NFATC1
sammen med sin feilregulert genet
IL6 product: [37]. Tidlig aktivering av
IL6
er nødvendig for ondartet transformasjon av normale celler i mus cellelinje-modell [38]. De fleste studier i T-celler viser at frigivelsen av IL6 avhenger av aktivering av
NFATC1 product: [39], som også er involvert i immunresponser av flere typer celler tilsvarende intestinal skade. Et annet godt rapporterte faktor
STAT3 product: [40] blir aktivert ved fosforylering på en måte som IL6 binder seg til sin reseptor. IL6 kan indusere transkripsjon av
STAT3
, og deretter utføre sin anti-apoptotiske og pro-tumorigene effekter gjennom
STAT3
og nedstrøms mål som
akt1 product: [41].
akt1 product: [42], [43] er viktig i reguleringen pattedyrcellevekst og overlevelse. Videre forskrifts forholdet mellom dem er allerede bekreftet av Iliopoulos et al. [44]; dette forholdet er mediert av MIR-21 og målet genet
PTEN
.
STAT3
kan indusere tumorigenicity av transformerte celler og påfølgende aktivering av
NF-kB product: [45], som er en annen måte å aktivere
IL6 product: [46].
Diskusjoner
Kreftforskning [47], [48] har generert et begrepsapparat som er nyttig for å forstå de komplekse og dynamiske endringer i kreftbiologi. De aller katalog av kreft fenotyper og genotyper er en fullt utslag av seks generelle kjennetegnene (eller egenskapene) som foreskrives av Hanahan et al., Sammen med inflammasjon, som er nylig kjent som «den syvende «[49]. Selv om år med kliniske og epidemiologiske undersøkelser har tilbudt akkumulert bevis på den sterke sammenhengen mellom betennelse og ulike kreft fenotyper, har få studier omfattende evaluert kjernetranskripsjonsfaktorer som medierer de feilregulert koblinger mellom IBDs og tilhørende CRC.
Rollene betennelse i karsinogenese er ganske komplisert og er dårlig forstått, selv om vi se bort fra retningen av årsakssammenheng mellom betennelse og kreft. Derfor, på basis av et begrenset antall av kreft og inflammasjon prøver, er det meget vanskelig å avgrense de mystiske og kompliserte koblinger mellom betennelse og kreft. Her, integrert vi en stor samling av mikromatrise ekspresjonsprofiler på nivå av nettverket, og hver for seg ekstrahert betennelse og kreft prøver med lignende transkripsjonelle nivåer av inflammasjon og kreftrelaterte gener.