PLoS ONE: Rekonstruksjon og analyse av transkripsjonsfaktor-miRNA Co-Regulatory Feed-Forward Loops i menneske kreft ved hjelp av Filter-wrapper funksjonsvalg

Abstract

Bakgrunn

Som en av de mest vanlige typene co regulerende motiver, fôr-forward sløyfer (FFLs) styrer mange cellefunksjoner og spiller en viktig rolle i kreft hos mennesker. Derfor er det avgjørende å rekonstruere og analysere kreftrelaterte FFLs som er kontrollert av transkripsjonsfaktor (TF) og mikroRNA (miRNA) samtidig, for å finne ut hvordan mirnas og TFS samarbeide med hverandre i kreftceller og hvordan de bidrar til kreftutvikling. Nåværende FFL studier stole på spådde regulering informasjon og derfor lide falsk positiv problemet i prediksjon resultater. Mer kritisk, FFLs generert av eksisterende tilnærminger kan ikke representere den dynamiske og betinget regulering forhold under ulike eksperimentelle forhold.

metodikk /hovedfunnene

I denne studien foreslo vi en roman filter-wrapper funksjonsvalg metode for å nøyaktig identifisere co-reguleringsmekanisme ved å innlemme tidligere informasjon fra forventede regulatoriske interaksjoner med parallelle miRNA /mRNA uttrykk datasett. Ved å bruke denne metoden, rekonstruert vi 208 og 110 TF-miRNA co-regulatoriske FFLs fra menneskelige pan-kreft og prostata datasett, henholdsvis. Videre analyse av disse kreftrelaterte FFLs viste at topp rangering TF STAT3 og miRNA HSA-la-7e er viktige regulatorer involvert i kreft hos mennesker, som har regulert mål betydelig anriket i cellulære prosessen forskrifter og signalveier som er involvert i kreftutvikling.

Konklusjon /Betydning

i denne studien, innførte vi en effektiv beregnings tilnærming for å rekonstruere co regulerende FFLs av nøyaktig identifisere genet co-regulatoriske interaksjoner. Styrken i den foreslåtte funksjonen valgmetoden ligger i det faktum det kan nettopp filtrere ut falske positiver i spådd regulatoriske interaksjoner ved kvantitativt å modellere komplekse co-regulering av målgener mediert av TFS og mirnas samtidig. Dessuten kan den foreslåtte funksjonen valgmetoden generaliseres til andre genregule studier ved hjelp av parallelle uttrykk data med hensyn til ulike biologiske sammenhenger

Citation. Peng C, Wang M, Shen Y, Feng H, Li A ( 2013) Rekonstruksjon og analyse av transkripsjonsfaktor-miRNA Co regulerende feed-forward Loops i Human kreft ved hjelp av Filter-wrapper funksjonsvalg. PLoS ONE 8 (10): e78197. doi: 10,1371 /journal.pone.0078197

Redaktør: Raya Khanin, Memorial Sloan Kettering Cancer Center, USA

mottatt: 11 juni 2013; Akseptert: 9. september 2013, Publisert: 29 oktober 2013

Copyright: © 2013 Peng et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet med tilskudd fra National Natural Science Foundation of China (61101061 til MW, 31100955 til AL). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Sentralt i alle biologiske organismer, er det tyde kompliserte genet regelverket mellom en gruppe av regulatorer og målgener viktig å lære de intracellulære fysiologiske aktiviteter og funksjoner i molekylært nivå. Det hjelper også å forstå den interne mekanismer for komplekse sykdommer

in vivo

. Regulatorene i genet forskrifter inneholder transkripsjonsfaktorer (TFS), som er proteiner som binder til spesifikke seter i promoter-regioner av målgener, således aktivere eller hemme ekspresjonen av dem. Andre regulatorer inkluderer endogene små (19-24 nukleotider) ikke-kodende RNA (mirnas) som involverer i reguleringen av genekspresjon på post-transcriptional nivå [1] ved å hemme oversettelsen prosedyre eller nedverdigende målet mRNA. Det er blitt funnet at både TFS og mirnas spiller en viktig rolle i humane cancere [1] – [5]. Ved hjelp av styring av mange biologiske prosesser i kreftutvikling og progresjon

Mange studier har funnet at TFS og mirnas er primære genet regulatorer i dyr og funksjon i en lignende regulatoriske logikk [6]. Derfor TFS og mirnas kan regulere det samme målet genet samarbeide på transkripsjons og post-transkripsjonsnivået hhv. På den annen side er mirnas regulert av TFS under transkripsjon fra genomet i kjernen og ekspresjonen av TFS kan også moduleres ved mirnas. Derfor er genet forskrifter ved TFS og mirnas ofte tett sammen, slik at en bestemt «feed-forward looper» (FFLs) [7] struktur med lukkede reguleringskretser. FFLs har blitt påvist som en ofthe mest vanlige typer co-transkripsjonen motivene [8] og det har blitt rapportert at hundrevis av miRNA-kontrollerte FFLs er tilgjengelig på genomet nivå [9], [10]. Ved å danne funksjonelle moduler i gennettverk (GRNs), FFLs kontrollere mange cellefunksjoner og også spille en viktig rolle i kreft hos mennesker, for eksempel, ved å støtte onkogene egenskaper onkogener [11] og påvirke en masse mål gener i kreftceller ved forskjellige biologiske pathways [12]. Dermed blir det viktig å rekonstruere og analysere TF-miRNA co-regulerende FFLs i kreft hos mennesker, for å finne ut hvordan mirnas og TFS samarbeide med hverandre i kreftceller og hvordan de bidrar til kreftutvikling.

En av utfordringene i å studere FFLs er ufullstendige opplysninger av regulatoriske mål. Ettersom det er bare et lite antall eksperimentelt verifisert mål, de fleste FFL studier vedta forskrifter fra beregnings prediksjon. For eksempel, for å finne kreft-relaterte mirnas og TFS, Yan

et al

. ut og rangert FFLs fra spådd TF og miRNA mål ved hjelp TRANSFAC og TargetScan [13]. Ye

et al

. også brukes FFLs hentet fra andre ressurser prediksjon å konstruere og analysere miRNA og TF co-regulatoriske nettverk i T-celle akutt lymfatisk leukemi [14]. Men disse spådde resultatene inneholder en stor andel av falske positiver, og mer kritisk FFLs generert av ovennevnte tilnærminger er statisk og kan ikke representere de dynamiske og betingede reguleringsforhold under forskjellige eksperimentelle forhold.

Foreløpig parallelle microarray eksperimenter har vært utført for å undersøke genet og miRNA uttrykk i kreft samtidig [15], [16], noe som gir en flott mulighet til å ta opp nevnte problemene ved hjelp ekspresjonsdata i gjenoppbyggingen av TF-miRNA co-regulatoriske FFLs. Nylig, Lu

et al

. foreslått en Lasso regresjonsmodell som benytter beregnings spådd regulatoriske interaksjoner og kreft parallelle uttrykk data å antyde miRNA-target regulatoriske nettverk [17], Yu

et al

. brukte trinnvis lineær regresjonsmodell (STEP) som også integrerer spådd forskrift med uttrykket data for å få en kombinatorisk nettverk av TF og miRNA i kreft [18]. Disse to avisene belyse metodikk for å bygge miRNA-involvert GRNs og revolusjonert vår forståelse av implikasjonene TFS og miRNAs i humane kreftformer. Men studiet av FFLs krever nøyaktig co-forskrifter, som FFLs representere seg selv som en subtil form for co-regulerende motiv. Derfor mer avanserte beregningsmetoder er foretrukket å nøyaktig rekonstruere FFLs fra uttrykk data ved hjelp av beregnede regulerings interaksjoner.

I denne studien foreslo vi en ny beregningsmetode basert på funksjonsvalg for å rekonstruere TF-miRNA co regulerende FFLs i kreft hos mennesker. Som en kraftig maskin læring teknologi, har funksjonen utvalget blitt mye brukt i mange områder av bioinformatikk, som for eksempel genet utvalg fra microarray data [19], slutning av genet nettverk [20], innhold og signalanalyse av sekvens [21] og massespektra analyse [21]. Vi ansatt to populære funksjonen utvalgsstrategier: filter og wrapper, for å effektivt oppdage co-forskrifter TFS og mirnas fra parallelle microarray data av kreft hos mennesker. Våre resultater viser at den foreslåtte metoden betydelig redusert den falske funnraten i de utledede regulatoriske forhold, som fører til mer nøyaktig FFL gjenoppbygging. Videre analyse av FFLs identifisert av den foreslåtte metoden viste at de inkluderte mange kjente kreftrelaterte gener og mirnas, indikerer deres funksjonelle betydning i kreft hos mennesker.

Materialer og metoder

Forut regulatoriske interaksjoner

Tre typer regulatoriske interaksjoner ble undersøkt i denne studien: TF til miRNA (TF-miRNA), TF til genet (TF-genet), og miRNA til genet (miRNA-genet). Vi har lastet ned spådd TF-miRNA interaksjoner fra cGRNB hjemmeside [18] med 11,599 regulatoriske par. For å hente kandidat TF-gen-interaksjoner, ble TF bindingssetene først trukket ut fra det TFbsConsSites fil fra UCSC [22] ved å følge fremgangsmåten beskrevet i [18], og deretter brukt til å skanne 1 kb oppstrøms til 0,5 kb nedstrøms fra transkripsjons-startsetene av alle referanse gener i UCSC. Resultatene ble videre kombineres til 7,059 TF-genet interaksjoner fra TRED database [23], som fører til totalt 130,338 TF-genet interaksjoner inkludert 16,534 målgener og 214 mennesker TFS. For miRNA-genet interaksjoner, resultatene av tre mest brukte miRNA mål prediksjon verktøy: PicTar [24], TargetScan [25] og Miranda [26] ble hentet fra miRGen database [27], som inneholder 75 968, 75 613 og 41 804 spådd miRNA- gen interaksjoner henholdsvis. Unionen av prediksjon resultater, blant 118,408 miRNA-genet interaksjoner med 276 menneskelige mirnas og 10,255 målgener, ble brukt for videre etterforskning.

Parallell mRNA og miRNA uttrykk datasett

Vi brukte to parallelle mRNA og miRNA uttrykk datasett for kreft hos mennesker, som representerer miRNA og mRNA uttrykk data fra de samme prøvene og under samme eksperimentet forhold. Det første datasettet inneholder NCI-60 mRNA expression data basert på Affymetrix HG-U133 chips [16] og de parallelle miRNA uttrykket data [15] fra CellMiner nettside. Dette pan-kreft datasett omfatter totalt 60 forskjellige humane kreftcellelinjer som stammer fra melanomer, leukemi og andre faste tumorer så som bryst, tykktarm, ovarie, lunge og prostata cancer. Denne parallelle uttrykk datasettet består av totalt 8388 gener og 195 mirnas [18]. Den andre parallelle mRNA og miRNA uttrykk datasett vedtatt i denne studien består av 111 prostatakreft og 28 normale prostataprøver, inkludert 373 mirnas og 19,253 mRNA [28]. Dette datasettet er tilgjengelig på GEO database med tiltredelse Nummer: GSE21032

Feature utvalg for å identifisere regulatoriske interaksjoner

For hvert mål (mRNA eller miRNA), settet av innledende funksjoner (dvs. alt spådd. TFS eller mirnas at regulere dette målet) inneholder vanligvis mer enn ett element på grunn av et stort antall av falske positiver i de forutsagte resultater. Deretter funksjonen matrise har

n

rader og

m

kolonner indikerer

n

regulatorer og deres uttrykk verdier i

m

prøver. Som første skritt, filtrert vi funksjonssettet for hvert mål ved hjelp av en effektiv mRMR metode (minimal-redundans-maksimal-relevans) [19] basert på gjensidig informasjon, som er et mye brukt mål for å definere avhengighet av variabler. Spesielt la

p product: (

x

) og

p product: (

y

) være den marginale sannsynlighetsfordelings funksjoner av to variable

x

og

y Hotell og

p product: (

x, y

) være den kombinerte sannsynlighetsfordelingsfunksjon, er gjensidig informasjon definert som: (1) Anta et mål

x

med uttrykket verdi

E

x

har to regulatorer

y

i

og

y

j

med uttrykks verdier

E

yi Hotell og

E

yj

. For eksempel, hvis

y

i

og

y

j

representerer en miRNA og TF deretter

E

yi Hotell og

E

yj

vil bli innhentet fra de parallelle miRNA og mRNA uttrykk data, henholdsvis. Den endelige funksjonssettet

S

etter filteret trinnet vil tilfredsstille to kriterier som brukes i mRMR metoden, dvs. maksimal relevans med målet og minimal redundans mellom regulatorer (dvs. å velge regulatorer som har ikke bare minimal redundans i gjensidig informasjon med hensyn til eksisterende regulatorer, men også maksimal gjensidig informasjon til målet), som formulert med ligning (2) og henholdsvis (3). Her

I

representerer gjensidig informasjon mellom to variabler. Fra rangeringen resultatene av mRMR, valgte vi opp til topp 20 kandidat regulatorer som er mest sannsynlig å ha interaksjon med målet for videre undersøkelser, som skal omfatte alle mulige regulatorer. (2) (3) Deretter trekk ved hvert mål ble ytterligere optimalisert ved wrapper funksjonen valgmetoden, og i dette trinnet vi ansatt en rekursiv bakover eliminering prosedyren. Vi modellert uttrykk verdiene av målet

i

(

E

xi

) og

p

regulatorer (

E

yi1

, …

E

Yip

) med lineær regresjon (ligning 4), der

β

i

er regresjonskoeffisienten og

ε

i

representerer feilleddet eller støy som genereres fra regresjonen prosessen. For hver gang, slettet vi regulatoren med den minste regresjonskoeffisienten fra featureset og gjentok prosessen ovenfor med de resterende regulatorer til funksjonene ble tom. De optimale egenskaper ble bestemt ved minste

p

-verdi (mindre enn 0,01) av den lineære regresjonsmodellen ved hjelp av F-test. (4)

gjenoppbygging og validering av TF-miRNA co-regulerings FFLs

De co-regulatoriske interaksjoner identifisert av filter-wrapper funksjonen valgmetoden består av tre typer regulatoriske forhold: TF-genet , miRNA-genet og TF-miRNA. For å rekonstruere co regulerende FFLs, utførte vi en uttømmende søk base på dybde-først-metoden for alle målgener i resultatene. For TF-FFLs, først en liste over mulige målgener som er kontrollert av minst én TF og miRNA ble generert. De miRNA regulatorer av hvert mål-genet ble deretter undersøkt etter tur, og en TF-FFL ble generert hvis målgenet og dens miRNA regulator ble begge styrt av en TF. For miRNA-FFLs ble genet liste samme mål som brukes og en miRNA regulerer både et mål genet i listen og dens TF ble valgt til å bygge en miRNA-FFL. Til slutt, for å identifisere kompositt-FFLs de rekonstruerte miRNA-FFLs ble videre undersøkt iterativt å se om TFS i disse FFLs også regulere de tilsvarende mirnas.

For å validere FFLs rekonstruert fra parallelle uttrykk datasett og tidligere informasjon fra beregnede regulerings interaksjoner, vi tilfeldig valgt samme antall interaksjoner fra forventede regulatoriske parene som vi rekonstruert de FFLs bruker ovenfor tilnærming. Denne prosedyren ble gjentatt 1.000 ganger for å generere empiriske fordelingen under nullhypotesen at FFLs rekonstruert ved vår tilnærming faktisk oppstå ved en tilfeldighet. Vi utførte en-utvalgs t-test basert på antall TF-FFLs, miRNA-FFLs og kompositt-FFLs rekonstruert fra pan-kreft datasett og beregnet

p

-verdi for å finne ut om denne nullhypotesen kan være forkastet ved signifikansnivå på 0,01.

i tillegg, for ytterligere å bekrefte viktigheten av FFLs til kreft, evaluerte vi den utførelsen av de identifiserte FFLs i klassifisere prostatakreft og normale prøver ved hjelp av parallell genekspresjonsdata. LIBSVM [29], en offentlig SVM bibliotek, ble valgt for klassifisering. La-ett-out kryssvalidering (LOOCV), som er den mest objektive og streng metode for å vurdere en klassifikator, ble vedtatt å evaluere klassifisering ytelsen til FFLs. For sammenligning, vi også brukt en baseline metode, der etikettene av kreft og normal uttrykk datasett ble permuted 100 ganger. For hver gang, ble SVM klassifiserere med de samme FFLs som genereres fra de permut ekspresjonsdata og deretter testet med den samme evalueringsprosedyren. Klassifiserings resultatene fra alle permutasjon tester ble i gjennomsnitt for å få grunnleggende ytelse.

Tre klassifisering ytelsesmålinger brukt i denne studien, nøyaktighet (

Acc

), sensitivitet (

Sn

) og spesifisitet (

Sp

) er definert som folllows: (5) (6) (7) Her

TP

,

TN

,

FP

og

FN

representerer sanne positive, sant negative, falske henholdsvis positive og falske negative,. I mellomtiden, ettersom størrelsene av kreft og normale prøver er svært forskjellige, Matthews korrelasjonskoeffisient (

Mcc

) ble anvendt, som er en balansert måling av kvaliteten av klassifiseringer [30]: (8) i tillegg vi også plottet mottakeren operatør karakteristiske (ROC) kurver for ytelse sammenligning, der x-aksen representerer 1-

Sp Hotell og y-aksen representerer

Sn

.

resultater

filter-wrapper funksjon utvalg

Et eksempel på filter-wrapper funksjonen utvelgelsesprosedyren bruker pan-kreft datasett er illustrert i figur 1. i filterfunksjon utvalg, topp rangering regulatorer valgt av mRMR demonstrere stor gjensidig informasjon, som indikerer høy relevans med målet genet (figur 1A). Figur 1B viser i begynnelsen, er det totalt 20 kandidat funksjoner med mulige falske positiver og

p

-verdi av assosiert lineær regresjonsmodell er 0.27. Når wrapper funksjonsvalg er utført, -verdi den tilsvarende

p

reduserer dramatisk, noe som tyder på en bedre modell som er mer nær ekte genregulering mekanisme. Den endelige modellen består av tre regulatorer med en optimal

p

-verdi på 3,9 × 10

-4. Videre viser boxplot av

p

-verdier for alle mål undersøkt i denne studien (figur 2A) funksjonsvalg generelt gjør mer nøyaktige regresjonsmodeller. Vi vurderte også den foreslåtte metoden ved beregning av Pearson korrelasjonskoeffisient (PCC), et mye brukt mål for å identifisere regulatoriske forhold [31], mellom kandidat regulatorer og mål. Som et resultat av betydelig høyere grunnfondsbevis (U-test

p

-verdi: 4,4 × 10

-167) ble observert i de regulatoriske interaksjoner etter funksjonsvalg (figur 2B). Tatt sammen, forbedrer filterhylster funksjon utvelgelsesmetode i stor grad påliteligheten av identifiserte regulatoriske interaksjoner ved å modellere nøyaktig parallelle ekspresjonsdata og effektivt å fjerne feilaktig antatte interaksjoner.

(A) Et eksempel som viser gjensidig informasjon om alle regulatorer i filtrere funksjonen utvelgelsesprosessen. Vi valgte topp-ranking regulatorer valgt av mRMR, som viser større gjensidig informasjonen verdier som indikerer høy relevans med målet genet. (B) Et eksempel som illustrerer

p

-verdi endring av lineær regresjonsmodell med emballering funksjonen utvelgelsesprosessen. Når 17 funksjoner er fjernet, den optimale

p

-verdi (markert med rød «*») funnet av wrapper funksjonen utvalget er 3,9 × 10

-4.

( A)

P

-verdier på de lineære regresjonsmodeller for alle målgener før og etter funksjonsvalg.

P

-verdier betydelig redusert etter at funksjonsvalg ble utført. (B) Pearson korrelasjonskoeffisienter (grunnfondsbevis) mellom alle målgener og deres regulatorer før og etter funksjonsvalg. Høyere grunnfondsbevis (U-test

p

-verdi: 4,4 × 10

-167) ble observert i de siste identifiserte regulatoriske interaksjoner

For å vurdere resultatene av den videre. foreslåtte metoden, permuted vi uttrykket verdiene av uttrykket data tilfeldig for 100 ganger og beregnet falsk discoveryrate (FDR) etter vedrørende interaksjoner generert fra de randomiserte datasett som falske positiver. Til sammenligning, vurderte vi også resultatene av to andre metoder: Lasso [17] og STEP [18]. Testingen prosessen ble gjentatt 3 ganger, og resultatene er vist i tabell 1. Med sammenlign varians, middelverdien av FDR for filterfunksjon valg er 0,11, som er betydelig mindre enn for Lasso og STEP. Videre, ved hjelp av filter og omslaget funksjonsvalg sammen, vi har observert en dramatisk reduksjon i fdr varians 1,24 til 0,38, noe som indikerer bedre konsistens og robusthet i forhold til andre fremgangsmåter. Videre er denne metoden ga en midlere FDR på 0,06, som er 5% bedre enn den filtermetoden. Samlet utgjør disse resultatene viser den overlegne ytelsen til filter-wrapper funksjonen valgmetoden.

Til slutt, vi undersøkt miRNA regulatoriske interaksjoner før og etter funksjonsvalg. Som vist i tabell 2, var det helt 190976 spådd miRNA-målet interaksjoner og de fleste av dem ble fjernet når funksjonen utvalg ble brukt, indikerer disse beregnede regulerings interaksjoner var enten falske positive eller ikke er relatert til kreft hos mennesker. I tillegg, ved å ty til miRTarBase [32] som inneholder eksperimentelt validerte miRNA mål, fant vi brøkdel av kjente regulatoriske interaksjoner ble betydelig økt i resultatene (tabell 2, hyperometrisk-test,

p

-verdi: 2,4 × 10

-3 for filterfunksjon utvalg, 4,0 × 10

-4 for filter-wrapper funksjonsvalg), som også støtter nytten av funksjonen utvalg i å oppdage regulatoriske interaksjoner.

TF og miRNA co-regulatoriske FFLs i kreft hos mennesker

fra 24,033 regulatoriske interaksjoner identifisert av funksjonsvalg, identifiserte vi tre typer FFLs i humane kreftformer (figur 3A): TF-FFL, miRNA-FFL og composite- FFL. I TF-FFL, er TF hoved regulator som direkte regulerer miRNA og målet genet mens miRNA regulerer også målet genet. Den miRNA-FFL har samme struktur med TF-FFL men hovedregulatoren er stedet miRNA. Kompositt-FFL er en kombinasjon av TF-FFL og miRNA-FFL, hvori TF og miRNA regulere hverandre mens de også regulere det samme målgenet. Merk disse FFLs har også blitt rapportert i andre studier av kreft [7], [13], [14], [33], [34], noe som tyder på at utbredelsen av FFLs i genregulering og mekanisme for kreftutvikling. Fra pan-kreft datasett, vi får rekonstruert 98 TF-FFLs, 106 miRNA-FFLs og 4 kompositt FFLs fra de identifiserte regulatoriske interaksjoner med funksjonsvalg. For ytterligere å validere disse kreftrelaterte FFLs, utførte vi en-utvalgs t-test ved å sammenligne rekonstruerte FFLs til de som genereres av tilfeldig utvalgte interaksjoner fra beregnede regulerings par (se metode), og gjennomsnittlig antall TF-FFLs, miRNA-FFLs og sammensatte FFLs i randomiserte interaksjoner var 56, 26 og 0,2, som var alt signifikant lavere (

p

-verdi: 1,2 × 10

-8 for TF-FFL, 2,0 × 10

-43 for miRNA-FFL, 9,9 × 10

-11 for kompositt-FFL) enn antall FFLs identifisert i menneske kreft.

(A) Tre typer tre-vertex FFLs funnet i humane kreftformer. I henhold til forholdet mellom miRNA og TF, den blandede FFLs som finnes i humane cancer ble klassifisert som TF-FFL (TF regulerer direkte miRNA og målgenet, mens miRNA regulerer også målgenet), miRNA-FFL (miRNA direkte regulerer TF og målet genet mens TF regulerer også målgenet) eller kompositt-FFL (TF og miRNA regulerer hverandre mens de også regulere det samme målet genet). (B) Felles TF-FFLs finnes i både pan-kreft og prostatakreft datasett. Røde sirkler angir mål gener; blå trekanter og oransje firkantene indikerer TFS og mirnas.

I mellomtiden, vi rekonstruert TF-miRNA co regulerende FFLs hjelp av prostatakreft datasett og sammenlignet dem med de som genereres fra normale prostata uttrykk data. Antallet co regulerende FFLs i prostatakreft var 110, og mye mer FFLs (425 totalt) ble identifisert i normale prostataceller. Videre fant vi sammensetningen av FFLs var også signifikant forskjellig (chi-kvadrat test,

p

-verdi: 1,7 × 10

-2), for eksempel andelen av miRNA-FFLs var 79% i prostata cancer mens dette antallet økt til 89% i normal prostatavev. Dette fenomenet innebærer mange vanlige co-regulerende FFLs er dramatisk undertrykt eller endret på prostatakreft. Til slutt sammenlignet vi FFLs rekonstruert fra pan-kreft og prostatakreft datasett og identifiserte to TF-FFLs (Figur 3B) som dukket opp i begge datasett. Interessant, mirnas i disse to FFLs, HSA-la-7a og HSA-la-7e, tilhører den HSA-la-7 familien som er relatert til prostata [35], bryst [36], lunge [37] kreft.

i tillegg utførte vi klassifisering analyse av prostatakreft og normale prøver ved hjelp av uttrykk data av mirnas og gener i nevnte co regulerende FFLs. Ytelsen til normale og kreft FFLs ble evaluert ved hjelp LOOCV og vist i Tabell 3. Både normale og kreft FFLs gi svært gode klasse resultater med

Acc

av 95,0% og 95,7%, repectively. Også

Sn

,

Sp Hotell og

MCC

målinger viser classfication resultatene av begge typer FFLs er veldig balansert. I tillegg, ved å bruke alle disse FFLs klassifiseringen ytelse er ytterligere forbedret med

Acc

,

Sn Hotell og

Mcc

økende til 97,1%, 99,1% og 0,909, henholdsvis som er signficantly bedre enn de til referansemetoden. Disse resultatene er også bekreftet av ROC kurver av ovennevnte tilnærminger (figur 4), noe som tyder på effektiviteten av disse FFLs i klassifisering prostatakreft og normale prøver og deres betydning for kreft.

Den grå, blå, grønn og rød kurvene er ROC-kurver for basislinje (en permutasjon), kreft FFLs, normale FFLs og alle FFLs, respektivt. Det største arealet under kurven indikerer de beste prestasjonene i klassifisering.

Sentrale aktører i kreftrelaterte FFLs

Vi beregnet forekomst av TFS og miRNAs i pan- kreft og prostatakreft FFLs. Som vist i tabell 4, er topprangerte TF og miRNA er STAT3 og HSA-la-7e, respektivt. Interessant, fant vi STAT3 dukket opp i 18 FFLs av prostatakreft (tabell 5), som i betydelig grad ble beriket forhold til de i normal prostata vev (chi-kvadrat test,

p

verdi = 2,6 × 10

-12) og i pan-kreft (chi-kvadrat test,

p

verdi = 3,8 × 10

-3). Dette fenomenet innebærer STAT3 er innblandet i prostatakreft. Det har blitt rapportert at STAT3 er konstitutivt aktivert i prostata cancer vev [38] og induksjon av ekspresjon STAT3 kan indusere en malign endring av normale prostata epitelceller [39]. Videre STAT3 har vist seg som et lovende terapeutisk mål for prostatakreft [40]. Alle disse observasjonene demonstrerer at STAT3 er en viktig kreft-relaterte TF og har en fremtredende betydning for forekomst og utvikling av prostatacancer. Videre har vi oppdaget mer enn 24% av målet for STAT3 funnet i pan-kreft også først på i prostata kreft. Videre analyse av funksjonelle anrikning av STAT3 mål i prostata cancer viste disse mål spilte en viktig rolle i en rekke cellulære prosess forskrifter innblandet i karsinogenese, for eksempel celleoverflatebinding og aktiviteten regulering av forskjellige slag av proteinaser (tabell 6). Resultatene av pathway analyse viste også disse mål var rikelig i Fruktose og mannose metabolisme og Notch signalveien.

TF-miRNA co-regulatoriske nettverk i kreft hos mennesker

Basert på FFLs rekonstruert i de to datasettene, vi videre inne pan-kreft og prostatakreft spesifikke TF-miRNA co-regulatoriske nettverk, og visualisert dem ved hjelp av Cytoscape programvare [41]. Som vist i figur 5, inneholder den pan-kreft ko-regulatoriske nettverk et totalt antall på 213 noder, inkludert 37 TFS, 17 mirnas og 159 andre gener. Den prostatakreft bestemt nettverk består av 118 noder med 27 TFS, 8 mirnas og 83 andre gener (figur 6). Vi beregnet graden (tilkobling) for hver node, og fant at navet med den største grad i begge nett var den samme miRNA HSA-la-7e. Dette resultatet er avtalt med FFLs analyse omtalt ovenfor, indikerer at HSA-la-7e kan være avgjørende i ulike kreft hos mennesker. Videre litteraturstudie viser at HSA-la-7e er medlem av la-7 familie som dukket opp som tumor suppressor [36], og har blitt rapportert å spille en viktig rolle i reguleringen av onkogener i multipletumors [42], [43].

Røde sirkler angir mål gener; blå trekanter og oransje firkantene indikerer TFS og miRNAs. Rød T-form kant: miRNA regulering; blå pil kant. TF regulering

Røde sirkler angir mål gener; blå trekanter og oransje firkantene indikerer TFS og miRNAs. Rød T-form kant: miRNA regulering; blå pil kant. TF regulering

subnettet av HSA-la-7e hentet fra pan-kreft FFLs (figur 7) omfatter 57 mål gener og 12 TFS inkludert mange kreftrelaterte gener som MYB, E2F2 og HAND1. MYB er proto-onkogen som har blitt identifisert til å forårsake en rekke leukemi [44]. E2F2 er cellesyklus-regulator hvis ekspresjon nivå øker i prostata kreftvev [45]. HAND1 har også blitt rapportert å spille en avgjørende rolle i kreftutvikling prosessen [46]. Vi har også gjennomført funksjons berikelse analyse av HSA-la-7e mål i pan-kreft og resultatene i tabell 7 viser at de er betydelig anriket i fem baner (hsa05200: Pathways i kreft, hsa05220: Kronisk myelogen leukemi, hsa00270: cystein og metionin metabolisme, hsa05222: Småcellet lungekreft, hsa05219: Blærekreft), hvorav fire banene er relatert til kreft hos mennesker. I alle disse resultatene viser at HSA-la-7e kan hemme prosessen med svulst forekomst og utvikling i ulike svulster ved å regulere ulike onkogener.

subnettet ble trukket med alle direkte knyttet noder av HSA-la-7e , som er vist å være navet i co-regulatoriske nettverk.

Diskusjoner

Menneskelige kreft er vanligvis preget av spredning av allsidige gener på ulike stadier av utviklingen med komplisert reguleringsmekanisme, derfor rekonstruksjon av genregulering i humane kreftformer, særlig med hensyn til dets komplekse, dynamiske og betinget funksjonen, kan i stor grad fremme vår kunnskap om opprinnelsen til kreft og dens ondartet oppførsel. I denne studien benyttet vi filter-wrapper funksjonen valgmetode for å identifisere regulatoriske interaksjoner mellom målgener og regulatorer, som vi videre rekonstruert TF-miRNA co-regulerings FFLs i humane kreftformer. Den foreslåtte metoden tar full nytte av parallelle uttrykk datasett og tidligere informasjon fra forventede regulatoriske interaksjoner å modellere og karakterisere den kompliserte co-reguleringsmekanisme i kreft hos mennesker.

Legg att eit svar