PLoS ONE: Identifikasjon av tykktarmskreft relaterte gener med mRMR og korteste veien i Protein-Protein Interaction Network

Abstract

En av de viktigste og mest utfordrende problemer i biomedisin og genomikk er hvordan man skal identifisere sykdomsgener. I denne studien har vi utviklet en beregnings metode for å identifisere kolorektal kreft-relaterte gener basert på (i) genuttrykket profiler, og (ii) den korteste veien analyse av funksjonelle protein foreningens nettverk. Den tidligere har vært brukt for å velge differensielt uttrykte gener som sykdomsgener i ganske lang tid, mens den sistnevnte har blitt mye brukt for å studere mekanismen for sykdommer. Med de eksisterende protein-protein interaksjonsdata fra STRING (Søk Tool for henting av å samhandle gener), en vektet funksjonelt protein foreningen nettverk ble bygget. Ved hjelp av mRMR (Maximum Relevant Minimum Redundancy) tilnærming, ble seks gener identifisert som kan skille mellom kolorektal tumorer og normalt vev tilstøtende colonic fra sine genekspresjonsprofiler. I mellomtiden, i henhold til den korteste veien tilnærming, vi videre funnet ytterligere 35 gener, hvorav noen har blitt rapportert å være relevant for tykktarmskreft og noen er svært sannsynlig å være relevant for det. Interessant, de genene vi identifisert fra både genuttrykk profiler og funksjonelt protein foreningen nettverk har flere kreftgener enn genene identifisert fra genuttrykk profiler alene. Dessuten, disse genene hadde også større funksjonell likhet med de rapporterte kolorektal kreft gener enn genene identifisert fra genuttrykk profiler alene. Alle disse indikerer at vår metode som presenteres i denne artikkelen er ganske lovende. Fremgangsmåten kan være et nyttig verktøy, eller i det minste spiller en rolle komplementær til den eksisterende fremgangsmåte for identifisering av tykktarmskreftgener. Det har ikke rømt vår varsel at metoden kan brukes til å identifisere genene til andre sykdommer i tillegg

Citation. Li BQ, Huang T, Liu L, Cai YD, Chou KC (2012) Identifisering av tykktarms kreft~~POS=TRUNC gener med mRMR og korteste veien i Protein-Protein Interaction Network. PLoS ONE 7 (4): e33393. doi: 10,1371 /journal.pone.0033393

Redaktør: Paulo Lee Ho, Instituto Butantan, Brasil

mottatt: 13 september 2011; Godkjent: 13 februar 2012; Publisert: 04.04.2012

Copyright: © 2012 Li et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet med tilskudd fra National Basic Research Program of China (2011CB510102, 2011CB510101, 2011CB910200 og 2010CB912702), Foundation Natural Science of China (90913009), Chinese Academy of Sciences (KSCX2-EW-R-04), en National High Tech Program Grant 2012AA022802 og innovasjonsprogram for Shanghai Municipal Education Commission (12ZZ087). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP (CRC) er en av de vanligste kreftformen hos de vestlige land og en viktig årsak til kreft dødsfall. Tidlig påvisning av CRC kan redusere sykelighet og bedre prognosen. Derfor er det av stor betydning for å identifisere kreft-relaterte gener som kan brukes som biomarkør for tidlig diagnose.

nylig, med utvikling av high-throughput bioteknologi, en stor mengde av biologiske data er generert, slik som gjær to-hybrid-systemer, proteinkompleks og genekspresjonsprofiler, etc. Disse data er nyttige ressurser for å utlede og å forstå genfunksjoner [1], [2], [3], [4], [5], [6 ], [7], [8]. Så langt protein-protein interaksjon (PPI) data har blitt mye brukt for genfunksjon forutsigelse med den forutsetning at samvirkende proteiner som har samme eller har lignende funksjoner, og følgelig kan være involvert i den samme bane. Denne «skyldig av foreningen» regelen ble først foreslått av Nabieva et al. [9], og kan også brukes til å identifisere kreftrelaterte gener.

STRING er en online database ressurs som er en forkortelse for Search Tool for henting av å samhandle Gener [10]. Det gir både eksperimentelle samt spådd interaksjon informasjon med en tillit poengsum. Algoritmer basert på PPI tyder på at proteiner med korte avstander til hverandre i nettet er mer sannsynlig å dele felles biologiske funksjoner [11], [12], [13], [14], og at interaktive naboer er mer sannsynlig å ha identisk biologisk funksjon enn ikke-interaktive dem [15], [16]. Dette er fordi spørringen proteinet og dets interaktive proteiner kan danne et proteinkompleks for å utføre en bestemt funksjon eller som er involvert i en reaksjonsvei samme.

Selv om den vellykkede anvendelse av high-throughput-data for genfunksjon undergang og identifikasjon av nye gener assosiert med kreft, feilene i high-throughput data er ikke godt løst ennå. I denne artikkelen, foreslo vi en ny metode for å identifisere CRC relaterte gener ved å integrere genuttrykk profil og en vektet funksjonelt protein assosiasjon nettverk konstruert med PPI data fra STRING. Denne metoden kan gjøre opp mangelen av bare bruker high-throughput data. I mellomtiden ble mRMR (maks relevans minimum redundans) algoritme [17] anvendes for å identifisere seks lovende kandidat gener som skiller tumor og normale kolorektal prøvene. Den Dijkstra algoritme [18] ble anvendt for å konstruere de korteste baner mellom hvert par av de seks genene. Videre ytterligere 35 gener på disse korteste banene ble også identifisert og analysert. For et slikt gen således identifisert, ble det observert at de inneholdt flere kreftgener enn genene som er identifisert fra de genekspresjonsprofiler alene. Videre de 41 genene hadde også større funksjonell likhet med de rapporterte CRC gener enn genene identifisert fra genuttrykk profiler alene. Det er forventet at noen av de 41 genene dermed identifisert kan tilhøre nye CRC relaterte gener.

Materialer og metoder

Datasett

Vi brukte genuttrykk data fra kolorektal kreft studie av Hinoue et al. [19]. Den genuttrykk profilering av 26 kolorektal tumorer og matchet tilstøtende prøver colonic vev histologisk normale ble hentet fra NCBI Gene Expression Omnibus (GEO) med tiltredelse antall GSE25070. Genuttrykket profilen ble innhentet ved hjelp av Illumina Ref-8 hel-genom uttrykk BeadChip med 24526 sonder som tilsvarer 18491 gener. Signalintensitet ble log2 transformert og deretter normalisert med RSN (Robust Spline Normalisering) -metoden.

vevsprøve representasjon

Basert på ovennevnte, representasjon av en vevsprøve kan formuleres som en 24526- D (dimensjonal vektor), som gitt ved (1) hvor representerer vevsprøve, kan verdien av det største sonde, og den transponerte matrise (jf Eq.6 for [20]).

kreftrelatert gen liste og to kolorektal kreft relatert gen lister

Vi utarbeidet tre genet lister fra offentlige databaser og publiserte arbeider for å sammenligne med de 41 kandidatgener vi identifisert. Disse tre gener lister inntatt en kreftrelatert gen liste og to kolorektal kreft relatert gen lister.

742 kreftrelaterte gener ble hentet fra tre kilder. Først fikk vi 457 kreftrelaterte gener fra Kreft Gene Census of Sanger Centre. Dernest, hentet vi kreftrelaterte gener fra Atlas of Genetics og Cytogenetisk i onkologi [21]. Den tredje delen ble samlet inn fra Human Protein Referanse Database [22]. Se Hjelpemiddel Informasjon S1.

Den første kolorektal kreft relatert gen liste ble hentet fra studiet av Sabates-Bellver og kollegaer [23]. De sammenlignet transcriptomes av 32 adenomer med normal slimhinne fra de samme personene og identifisert 438 gener med markert endret uttrykk i kolorektale adenomer sammenlignet med normal slimhinne med Affymetrix U133 Plus 2.0 array. Se Hjelpemiddel Informasjon S1.

Den andre kolorektal kreft relatert gen listen ble hentet danner en nyere verk av Nagaraj et al. [24]. De foreslo en boolsk baserte systemer biologi tilnærming med skyldfølelse-by-foreningen algoritme for å identifisere nye kreftassosierte gener. Vi samlet alle de 134 nye CRC relaterte gener identifisert i denne studien. Se Hjelpemiddel Informasjon S1.

PPI data fra STRING

Den første veide PPI nettverket ble hentet fra STRING (versjon 9.0) [10] (https://string.embl.de/), noe som er en stor database av kjente og forutsagte protein interaksjoner. Proteiner i samspillet nettverket var representert med noder, mens interaksjonen mellom hvilke som helst to proteinene deri var representert med en kant. Disse interaksjonene inneholde direkte (fysiske) og indirekte (funksjonelle) interaksjoner, som stammer fra en rekke kilder som eksperimentelle repositories, beregnings prediksjon metoder. I nettverket, er hver kant merket med en poengsum for å kvantifisere samspillet tillit, dvs. sannsynligheten for at det kan oppstå et samspill.

Den mRMR (maks relevans minimum redundans) metoden

For å finne gener som kan skille tykktarmssvulster og normale tilstøtende vev, brukte vi mRMR metoden, som opprinnelig ble utviklet av Peng et al. [17] for å analysere mikroarray data. Den mRMR metoden kan rangere gener i henhold til deres relevans til klassen av prøvene berørte, og i mellomtiden også kunne ta redundans av gener i betraktning. Disse genene, som har den beste avveining mellom det maksimale relevans til prøven klasse og minimum redundans, ble ansett som «gode» biomarkører.

Både relevans og redundans ble kvantifisert ved følgende gjensidig informasjon ( MI) 🙁 2) der og er vektorer, er deres felles sannsynlighetstetthet, og og er de marginale sannsynlighetstetthet.

For å kvantifisere både relevans og redundans, la oss definere som hele genet settet, som allerede valgt genet sett som inneholder gener og som å-være-valgt genet sett som inneholder gener. Relevansen mellom genet og målet kan beregnes ved: (3) redundans mellom genet og alle genene i kan beregnes ved: (4) For å oppnå genet i sammen med den maksimale relevans og minimum redundans la oss kombinere Eq.3 og Eq.4, som kan formuleres som følger: (5) Gitt et gen sett med gener, vil mRMR operasjon for genet evaluering fortsette runder. Etter disse vurderingene, vil mRMR metoden genererer et gen satt som formulert av (6) hvor indeksen indikerer hvilken runde genet er valgt. Jo mindre indeksen er, jo tidligere genet fornøyd ligning 5 og bedre genet er.

Tippe motor

I denne studien, nærmeste nabo algoritme (NNA) [25], [26], som har blitt mye brukt i bioinformatikk og databiologi [3], [27], [28], [29], [30], [31], [32], [33], [34], ble vedtatt å forutsi klassen av kolorektal vevsprøver. Den «nærhet» ble beregnet i henhold til den følgende ligning (7) der og er to vektorer som representerer to vevsprøver, er deres dot produkt, og er deres moduluses. Jo mindre, mer tilsvarende de to prøvene er [35]. For en intuitiv illustrasjon av hvordan NNA fungerer, se figur 5 for [20].

Ytelse validering

Følgende tre kryssvalideringsmetoder blir ofte brukt i statistikk for å validere et statistisk prediksjon metode : uavhengige datasett test, delsampling test, og knytnings test [36]. Imidlertid, blant de tre valideringsmetoder, er det knytningstesten på minst vilkårlig på grunn av de følgende fakta. (I) For uavhengige datasett test, selv om alle prøvene brukes til å teste prediktor er utenfor opplæring datasettet brukes til å trene prediksjon motor, slik som å utelukke «minne» effekt eller bias, veien for hvordan du velger uavhengige utvalg for å teste prediktoren kan være ganske vilkårlig, med mindre antallet uavhengige prøver er tilstrekkelig stor. Denne typen vilkårlighet kan føre til helt motsatte konklusjoner. For eksempel kan den konklusjon at en prediktor gitt en høyere suksessrate enn den andre prediktor for en gitt uavhengig testing datasett blir bare motsatt under testing av en annen uavhengig testing datasett [36]. (Ii) For det subsampling test, betong prosedyre vanligvis anvendes i litteraturen er den 5-fold, 7-gangers eller 10-gangers kryssvalidering. Problemet med denne type subsampling testen er at antallet mulige valg i å dividere en referansedatasettet er ekstremt stor, selv for en meget enkel og liten datasettet, som belyst i [37] og demonstrert ved Eqs.28-30 i [20] . Derfor, i noen faktiske Delsampling kryssvalideringstester, er bare en svært liten brøkdel av de mulige valgene tatt i betraktning. Siden forskjellige valg vil alltid resultere i ulike utfall selv for en samme benchmark datasett og samme prediktor kan delsampling testen ikke unngå vilkårlighet heller. En testmetode ute av stand til å gi en unik resultat kan ikke anses som en god ett. (Iii) I jackknife testen, vil alle prøvene i referansedatasettet bli blinket ut en etter en og testet av prediktor trent av de resterende prøvene. Under prosessen med knytning, både treningsdatasettet og testing av datasettet er egentlig åpen, og hver prøve vil være i sin tur beveget mellom de to. Den knytnings test kan utelukke «minne» effekt. Dessuten kan vilkårlighet problemet som er nevnt ovenfor for den uavhengige datasett test og subsampling test unngås fordi den som oppnås ved knytningstesten resultatet er alltid unik for en gitt referanse datasett. Følgelig har knytningstest har blitt mye og i økende grad benyttes for å kontrollere kvaliteten på forskjellige prediktorene (se, for eksempel, [30], [31], [32], [38], [39], [40], [41] , [42], [43], [44], [45], [46]). . Følgelig, i denne studien den knytningstesten ble også brukt til å undersøke kvaliteten av den aktuelle prediksjonsmetode

Prediksjonsnøyaktigheten ble formulert ved (8) hvor TP representerer den sanne positive; TN, den sanne negative; FP, den falske positive; og FN, den falske negative.

Inkrementell funksjonsvalg (IFS)

Basert på rangert genene i henhold til deres viktighet etter mRMR evalueringen har vi brukt Inkrementell funksjonsvalg (IFS) (se f.eks, [1], [47]) for å bestemme det optimale antall gener som biomarkører. Under IFS prosedyren, er gener i rangert genet sett lagt en etter en fra høyere til lavere rang. Et nytt gen sett består når man gen tilsettes. Således gensettene ville være sammensatt når gitt rangert gener. Genet sett er (9) For hver av de N gensettene, ble en NNA prediktor konstruert og undersøkt ved hjelp av jackknife test til referansedatasettet. Ved å gjøre så vi fikk en IFS tabell med en kolonne for indeksen

i

og en annen kolonne for prediksjon nøyaktighet. Dermed kan vi oppnå optimal gen set (), med som prediktor ville gi den beste prediksjon nøyaktighet.

Graf tilnærming og korteste stier sporing

Grafer er et nyttig redskap for å studere komplekse biologiske systemer fordi de kan gi intuitive innsikter og den overordnede strukturen egenskapen, som vist i ulike studier på en rekke viktige biologiske emner (se, for eksempel, [48], [49], [50], [51], [52], [53], [54], [55], [56], [57], [58]). I denne studien vi først konstruert en graf G (V, E) med PPI data fra STRING. I diagrammet, ble en kant tildelt for hvert par av gener hvis de var i samspill med hverandre. Vekten av kanten E i graf G ble avledet fra den konfidensverdi ifølge ligningen, der er vekten i graf G, mens det konfidensverdi mellom to proteiner involvert. Dermed får vi et funksjonelt protein forening nettverk med kant vekt. Dijkstra algoritme [18] ble brukt til å finne den korteste veien fra hver av de seks genene til alle de andre fem gener i diagrammet. Så vi plukket ut alle de genene som finnes i de korteste stier og rangere disse genene i henhold til deres betweenness.

KEGG berikelse analyse

Funksjonell merknad verktøyet for DAVID [59] ble brukt for KEGG vei berikelse analyse. Den berikelse p-verdi ble korrigert til å kontrollere familie bredt falske funnraten under visse hastighet (f.eks ≤0.05) med Benjamin multippel testing korreksjon metoden [60]. Alle genene på BeadChip ble valgt som bakgrunn under berikelse analyse.

Resultater

mRMR resulterer

Uttrykket profilen ble hentet fra GEO med tiltredelse antall GSE25070, som inneholdt 52 ​​prøver og 24,526 prober og ble forvandlet til en CSV-fil med 52 rader og 24526 kolonner som input av mRMR. Hver sonde representerte en funksjon og de 26 tumorprøver tilhørte klasse 1, mens paired26 sammenkoblede normale prøver tilhørte klasse 2. Etter å ha kjørt mRMR programvare, fikk vi to tabeller (se saksdokumenter S2), hvorav den ene ble kalt MaxRel tabell som rangert sondene i henhold til deres relevans til klassen av prøvene, og den andre heter mRMR funksjonen tabell som oppført sondene med maksimal relevans og minimum redundans til klassen av prøvene.

Seks kandidat gener identifisert av NNA og IFS

på grunnlag av utgangene fra mRMR, konstruerte vi 1000 har undergrupper i henhold til Eq.9. Som beskrevet i Materialer og metoder, testet vi prediktor med en funksjon, to funksjoner, tre funksjoner, etc., og IFS resultatet kan bli funnet i saksdokumenter S3. Vist på fig. 1 er den IFS kurven plottet basert på data fra Hjelpemiddel Informasjon S3. I IFS kurve, er X-aksen antall sonder som brukes for klassifisering, og Y-aksen er forutsigelseskoeffisientene nøyaktighet på nærmeste nabo-algoritmen vurderes av den knytningstesten. Maksimal nøyaktighet var en da 6 funksjoner ble inkludert. Den optimale probe sett inkludert 6 sonder som tilsvarer 6 forskjellige gener, som var GUCA2B, PI16, CDH3, SPIB, BEST2, og HMGCLL1 (tabell 1).

I IFS kurven, er X-aksen for antall prober som brukes for klassifisering, og Y-aksen for prediksjon nøyaktighet ved nærmeste nabo algoritmen (NNA) evaluert av jackknife (Leave-One-Out) kryssvalidering test. Toppen nøyaktighet var en med seks sonder. Toppen 6 sonder i sonden liste mRMR dannet optimal diskriminerende probe sett.

Korteste stier gener

I mellomtiden konstruerte vi en urettet graf med PPI data fra STRING . Da vi plukket ut to gener fra de seks genene er identifisert med den mRMR fremgangsmåte som beskrevet ovenfor, og funnet ut den korteste vei mellom disse to gener med Dijkstra algoritme. Vi fikk totalt 15 korteste stier med lavest kostnad (Hjelpemiddel Informasjon S4). Vist på fig. 2 er de 15 korteste baner mellom de seks kandidatgener, hvor interaksjonen tillit ble merket på kanten til hver av interaksjon genet parene. Det var totalt 35 gener på de korteste stier og vi rangert disse genene i henhold til deres betweenness (tabell 2). Blant disse 35 genene, har AR den største betweenness på 7, noe som betyr at det er 7 korteste stier som går gjennom dette genet. Følgelig, kan AR spille en viktig rolle i å koble de seks kandidatgener og følgelig kan være relatert til CRC. En slik konklusjon er helt i overensstemmelse med det faktum at AR-protein ble funnet i normal tykktarmsslimhinne, så vel som i de fleste CRC [61], [62], noe som tyder at AR-reseptoren er ansvarlig for de mitogene effekter av hormonet som vil bli ytterligere diskutert senere.

de 15 korteste stier mellom de seks kandidat gener ble identifisert med Dijkstras algoritme basert på PPI data fra STRING. Gul roundrect representerer de seks beste kandidat gener identifisert av mRMR metoden. Røde runde representerer de 35 gener som foreligger i området for de korteste baner. Tallene på kantene representerer kant vekter for å kvantifisere samspillet tillit. Jo mindre tallet er, jo sterkere samspillet mellom to noder er. Se teksten i avsnitt av «Graph tilnærming og korteste stier tracing» for den kvantitative forholdet mellom kanten vekt med tillit poengsum mellom to proteiner berørte.

For å teste om vår 35 kortest sti gener var knutepunkter i bakgrunnen nettverk eller ikke, vi kjørte en permutasjon å telle forekomsten tiden av våre 35 korteste sti gener i de korteste stier mellom 6 tilfeldige utvalgte gener når de har større betweenness enn i vår studie. Vi gjentok denne fremgangsmåten 5000 ganger, og den p-verdi ble beregnet som andel av forekomsten tid av de 35 gener i 5000 permutasjon. For detaljer, se tabell 2. Det var 10 korteste vei gener hvis p-verdier var ikke signifikant. TP53 var en stjerne molekylær involvert i en rekke biologiske prosesser og nesten relatert til alle typer kreft [63]. Derfor er det ikke noe overraskende at TP53 dukket opp mange ganger i korteste veien mellom 6 tilfeldig plukket gener. For EP300, har det blitt rapportert at dette genet kan acetylere TP53 og forbundet med mange tumorer [64]. CTNNB1 og GSK3B hører til Wnt signalveien, rollen som i caners har blitt godt dokumentert [65]. For de resterende ubetydelige 6 gener, deres betweennesses i vår studie var alle ett (tabell 2), og dermed antall forekomster for disse genene i tilfeldige korteste stier er tilbøyelige til å være større enn én. De fleste av disse ubetydelige 6 korteste vei gener falle bak i tabell 2 i henhold til deres betweennesses, noe som tyder på at de ikke kan være viktig. I tillegg til disse 10 genene, ble de resterende 25 korteste vei gener i vår studie identifisert til å være betydelig.

MaxRel tabellen genet KEGG berikelse

Bruke funksjonell annotering verktøy for David, KEGG pathway berikelse analyse ble utført for genene som tilsvarer de 1000 probene som er oppført i MaxRel. Anrikningen Resultatene viste at disse genene var signifikant anriket i energimetabolismen veier, inkludert fettsyremetabolisme, pentose- og glukuronat omdannelser, så vel som stivelse og sukrose metabolisme (tabell 3). Disse resultatene antydet at metabolismen av næringsstoffer kan spille avgjørende rolle i tumorigenesis av CRC.

Seks kandidat gener og korteste stier gener KEGG berikelse

KEGG pathway berikelse analyse ble også utført på de 41 genene inkludert de seks gener i mRMR liste og 35 gener i de korteste stier mellom disse seks gener med den funksjonelle merknad verktøyet for DAVID. Anrikningen resultat oppnådd på denne måten viste at disse gener ble vesentlig anriket på canonic kreft beslektede reaksjonsveier, for eksempel prostatakreft, baner i kreft, Wnt signalveien, cellesyklus, kolorektal kreft, thyroid kreft, og så videre. Det er lærerikt å merke seg at blant disse banene, noen har vist seg å være relevant for tykktarmskreft inkludert Wnt signalveien, cellesyklus, tykktarmskreft og insulin signalveien (tabell 4).

Overlapping med kreftrelaterte genet liste og to CRC relatert gen lister

Vi samlet 742 kreftrelaterte gener fra følgende tre ulike kilder: Cancer Gene Census fra Sanger Centre, Atlas of Genetics og Cytogenetisk i onkologi [21], og Humant protein Referanse Database [22]. Det ble observert at 8 av de 41 gener som er identifisert av oss ble påvist å være kreftrelatert gener. Det ble også indikert ved Fishers eksakte test at disse 41 gener ble signifikant relatert til kreft (p-verdi = 0,0001908). Se Hjelpemiddel Informasjon S5.

I tillegg samlet vi 438 gener som var forskjellig uttrykt mellom kolorektal adenom og normal slimhinne fra forrige undersøkelse [23]. Interessant, de nevnte 41 kandidatgener identifisert av oss hadde en overlapping av 4 gener med 438 gener, og overlappingen var ganske signifikant (p-verdi = 0,01057, Fishers eksakte test). Se Hjelpemiddel Informasjon S5.

Nylig, boolsk baserte systemer biologi tilnærming ble benyttet for å identifisere 134 nye CRC relaterte gener [24], hvorav tre ble identifisert av oss i denne studien og overlapp var signifikant (p- verdi = 0.002017, Fishers eksakte test). Se Hjelpemiddel Informasjon S5.

Diskusjoner

KEGG berikelse av MaxRel gener

De genene som tilsvarer de 1000 prober oppført i MaxRel tabellen ble betydelig anriket i energiomsetningen trasé, herunder fettsyremetabolisme, pentose- og glukuronat omdannelser, så vel som stivelse og sukrose metabolisme. Det har vist seg at kostholdet har en viktig effekt på CRC utvikling. Våre funn er ganske konsistent med det faktum at genetiske polymorfismer påvirker metabolismen av næringsstoffer spiller en viktig rolle i etiologien av CRC og colorectal adenomatøse polypper [62].

Flere linjer av bevis har antydet innblanding eller involvering av fett i etiologien av CRC [66]. Det avgjørende rolle fettsyrer i en rekke biologiske prosesser tyder på at endring i fettsyre metabolizing gener bidrar til tykktarmskreftutvikling [67]. Det har vist seg at stivelse og sukrose metabolisme og pentose og glucuronateinterconversions var nær knyttet til kreft. Christensen et al. [68] viste at stivelse og sukrose metabolisme og pentosen og glucuronateinterconversions veien ble hypomethylated i isocitrat dehydrogenase muterte tumorer. I tillegg ble disse to metabolske veier funnet å være signifikant relatert til risikoen for utvikling av østrogenreseptor-negative brystkreft [69].

En nylig CRC sykdomsspesifikk transkriptomet forskning viste at stivelse og sukrose metabolisme var ett av syv felles sti betydelig forskjellig reguleres ved hjelp av to ulike microarray plattformer, inkludert Affymetrix HGU133 Plus2.0 matrise og CRC sykdom spesifikke array. Dessuten ble fettsyremetabolisme identifisert som signifikant forskjellig regulert vei ved hjelp av kolorektal sykdom bestemt matrise [70].

Seks kandidat gener identifisert av mRMR, NNA og IFS

I denne studien har vi identifisert følgende seks gener: GUCA2B, PI16, CDH3, SPIB, BEST2, og HMGCLL1. Nedenfor, la oss kort diskutere sine relasjoner med tykk- og endetarmskreft.

GUCA2B (uroguanylin) er en endogen aktivator av guanylatsyklase-2C reseptoren funnet å være nedregulert 8 ganger i adenom, og dens uttrykk er oppdaget i blod og urin [71] .Derfor, GUCA2B kan betraktes som en ikke-invasiv biomarkør for tidlig deteksjon av CRC. I tillegg er det radioaktivt merket uroguanylin analoger er blitt anvendt for deteksjon av CRC in vivo [72].

PI16 (Peptidase inhibitor 16) blir funnet i testikler, prostata, tynntarm, tykktarm, eggstokk og med immunhistokjemisk analyserer [73]. Nedgang på PI16 nivå ble oppdaget i prostata kreft [73] og magekreft [74]. Vår Resultatet viste også at uttrykket av PI16 i kolorektal adenokarsinom ble signifikant redusert sammenlignet med tilstøtende ikke-tumor kolorektal vev, som var i overensstemmelse med resultatet av forskningen i prostata cancer og gastrisk kreft. Siden PI16 ikke er godt karakterisert og så langt er det ingen rapport overhodet om PI16 i kolorektalkreft etiologi, vår Resultatet innebar at PI16 kan bli et lovende biomarkør for kolorektal kreft tidlig diagnose.

CDH3 er en klassisk cadherin, den demetylering av som ofte oppdages i avansert CRC som ble assosiert med overekspresjon av CDH3 [75]. Dess CRC, ble CDH3 også overuttrykt i de fleste av kreft i bukspyttkjertelen og magekreft, men ikke i sine noncancerous motstykker eller i normale vev. Således ble CDH3 betraktet som en ny tumor-assosiert antigen nyttig for immunterapi og tidlig diagnose av magekreft og CRC [76].

SPIB er en transkripsjonsfaktor av E-tjueseks (ETS) familien, hvilken er kjent for å opptre som positive eller negative regulatorer av genuttrykk. SPIB er et adenom tilstand spesifikke ned regulert gen og dens uttrykk gikk en slående reduksjon i CRC vev som indikerer at SPIB kan tjene som potensielle markører for CRC invasivitet og metastasering [77].

BEST2 (også kjent som VMD2L1) koder for et protein av bestrophin familien. Både RT-PCR-analyser og X-gal-farging viste vev-begrenset BEST2 og VMD2L2 rikelig uttrykt i tykktarmen [78], [79]. Det har blitt vist at BEST2 formidler bikarbonat transport av slimceller i mus tykktarmen [80]. Straub et al. [81] identifisert BEST2 som en av de metylering markører for tidlig oppdagelse og prognose for CRC. Derfor BEST2 var ventet å bli en terapi mål for CRC med demetylering agent.

HMGCLL1 har vært show å være relatert til ulike kreftformer, som bukspyttkjertel kreft [82], glioblastom multi [83], bryst og tykktarms kreft [84]. HMGCLL1 er ett av genene som inneholder somatiske mutasjoner i kreft i bukspyttkjertelen [82]. Selv mutasjon i HMGCLL1 har blitt rapportert å være involvert i disse kreftformene, de spesifikke mekanismene bak gjenstår å bli belyst.

Korteste vei gener

helt identifisert 35 korteste stier gener. Som vi kan se av tabell 2, noen korteste vei gener som TP53, EP300, CTNNB1 og GSK3B var ikke signifikant for CRC på grunn av deres universalitet i en rekke kreftformer. Imidlertid har disse genene er godt dokumentert å være relevant for CRC, og også deres rolle i CRC har blitt godt karakterisert [85]. I tillegg til disse genene har de fleste av de andre korteste gener som er oppført i tabell 2 var ganske spesifikke for CRC (p-verdi 0,05). Nedenfor, la oss fokusere på de spesifikke gener med de store betweenness verdier og drøfte forholdet mellom slike gener med CRC.

AR (androgen reseptor) er en ligand avhengig transkripsjonsfaktor, som er involvert i kontrollen av mobilnettet spredning og differensiering [86]. Flere studier har gitt støtte bevis for sitt engasjement for sex steroidhormoner (østrogener og androgener) i etiologien og progresjon av CRC [87]. AR-protein er blitt vist å bli uttrykt i normal tykktarmsslimhinne, og i de fleste kolorektal kreft [61], [62], som støtter at CRC som uttrykker AR-reseptoren kan svare på mitogene effekter av hormonet. Videre somatiske reduksjoner av androgen receptor CAG gjentar det ofte oppstår, gjennom en sti forskjellig fra mikro ustabilitet og tidlig under tykktarmskreftutvikling. Tilsynelatende vekst utvalg av celler som forkortede AR alleler antyder at androgener bidra til tykktarmskreftutvikling i en ennå ukjent måte [61].

TBP (TATA-bindende protein) er en nøkkel eukaryote transkripsjonsfaktor som brukes av alle tre celle RNA polymeraser.

Legg att eit svar