PLoS ONE: utlede opprørt mikroRNA regulatoriske nettverk i Cancer Bruke hierarkisk Gene Co-Expression Signatures

Abstract

microRNAs (mirnas), en klasse av endogene små regulatoriske RNA, spiller viktige roller i mange biologiske og fysiologiske prosesser . De forstyrrelser av enkelte mirnas, som vanligvis kalles som onko-microRNAs (onko-Mirs), er signifikant assosiert med flere faser av kreft. Selv om hundrevis av miRNAs har blitt oppdaget, blir de forstyrrede miRNA regulatoriske nettverk og deres funksjoner fortsatt dårlig forstått i kreft. Analysere uttrykk mønstre av miRNA mål gener er en veldig nyttig strategi for å antyde de forstyrrede miRNA nettverk. Men på grunn av kompleksiteten av kreft transkriptomet, dagens metoder ofte støter lav følsomhet og rapportere noen onko-MIR kandidater. Her har vi utviklet en ny metode, kalt miRHiC (berikelse analyse av miRNA mål i Hierarkiske genet Co-uttrykk signaturer), for å antyde de forstyrrede miRNA regulatoriske nettverk ved hjelp av hierarkiske co-uttrykk signaturer i stor skala kreft genuttrykk datasett. Metoden kan antyde onko-MIR kandidater og deres mål nettverk som er bare knyttet til sub-klynger av de differensielt uttrykte gener på fine skjell av co-uttrykk hierarki. På to reelle datasett av lungekreft og leverkreft, miRHiC avdekket flere kjente onko-Mirs og deres mål gener (som MIR-26, MIR-29, MIR-124, MIR-125 og MIR-200) og også identifisert mange nye kandidater (slik som MIR-149, som er antydet i begge typer kreft). Ved hjelp av hierarkiske genet co-uttrykk signaturer, kan miRHiC øke følsomheten for inferring de forstyrrede miRNA regulatoriske nettverk i kreft. Alle Perl-skript av miRHiC og detaljerte dokumenter er fritt tilgjengelig på Internett på https://bioinfo.au.tsinghua.edu.cn/member/jgu/miRHiC/

Citation. Gu J, Xuan Z (2013) konkludere de opprørt mikroRNA regulatoriske nettverk i Cancer Bruke Hierarkiske Gene Co-Expression signaturer. PLoS ONE 8 (11): e81032. doi: 10,1371 /journal.pone.0081032

Redaktør: Joaquin Dopazo, Centro de Investigacion Principe Felipe, Spania

mottatt: 29. mai 2013; Godkjent: 09.10.2013; Publisert: 20.11.2013

Copyright: © 2013 Gu, Xuan. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet er støttet av National Basic Research Program of China [2012CB316503], Natural Science Foundation National Kina [61005040, 61370035], National Institute of Health [U01 ES017166] og Tsinghua National Laboratory for Information Science and Technology Cross-disiplin Foundation. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

microRNAs (mirnas) er en klasse av små (~22 nt) regulatoriske RNA, som spiller viktige roller i mange viktige biologiske og fysiologiske prosesser, slik som embryo utvikling, kreft progresjon og immunrespons. Om 1400 mirnas har blitt identifisert i menneskelig og mer enn 30% kjente proteinkodende gener potensielt regulert av evolusjonære konserverte mirnas [1], [2]. De forstyrrelser av noen mirnas, vanligvis kalt onko-microRNAs (onko-Mirs, inkludert både onkogene og kreft undertrykkende mirnas i denne studien), har blitt rapportert å være signifikant assosiert med flere stadier av kreft. Men til nå, bare noen få av de hundrevis av mirnas er knyttet til komplekse dys regulert cellulære prosesser i kreft. Det er et stort behov for dedusere de forstyrrede miRNA regulatoriske nettverk og deres funksjoner i kreft [3].

For å antyde opprørt miRNA regulatoriske nettverk, er en populær strategi for å analysere miRNA målet genet sett enrichments i forskjellig uttrykt gen signaturer. Dette inkluderer mange utviklede metoder, for eksempel genet sett analyse av hyper-geometrisk test (HG-test, eller Fishers eksakte test); GSEA (-genet satt anrikning analyse) [4], [5]; FAME (funksjonell tildeling av miRNAs via berikelse) [6]; og miRBridge [7], som forutsetter at målet genet sett enrichments reflektere forstyrrelser av sine oppstrøms miRNA regulering styrker. Men på grunn av kompleksiteten av kreft transkriptomet, disse metodene vanligvis viser lav følsomhet for å utlede onko-MIR kandidater (her, den «følsomhet» betyr i hovedsak antall utledet onko-MIR kandidatene i henhold til en gitt statistisk signifikans-nivå).

Kreft er en flertrinns prosess og blandet, vanligvis involverer mange hierarkisk organisert delprosesser som reguleres ved flere skalaer [8]. Mirna regelverket viser også tilhører multi-skala [9]: noen mirnas, som bidrar til å bestemme celletyper eller cellulære tilstander, undertrykke hundrevis av mål genekspresjon å opprettholde celletype eller celle tilstand spesifikke uttrykk profiler, slik som MIR-124 i hjernen og Mir-1, MIR-133 i muskel [10], [11], [12]; kan imidlertid mange andre mirnas bare regulere noen spesifikke prosesser ved å målrette en liten gruppe av nært beslektede gener. Den tidligere slags kandidat onko-Mirs kan lett identifiseres ved å analysere berikelse av sine mål gener i hele settet av forskjellig uttrykte gener, men de sistnevnte er ofte savnet av eksisterende metoder på grunn av utilstrekkelige target genet enrichments i forskjellig uttrykt gener eller i co-uttrykk signaturer ved hjelp av forhåndsdefinerte likhet tidsavgrensninger.

i denne studien, foreslo vi en ny strategi for å utlede onko-Mirs og deres forstyrrede regulatoriske nettverk. Denne strategien tar hensyn til multi-skala og hierarkisk organisert regulatoriske strukturer i de forskjellig uttrykte gener ved hjelp av gen co-uttrykk informasjon, og finjusterer skalaene i genet co-uttrykk hierarki for å analysere miRNA målet genet sett berikelse. Vår metode, navngitt som miRHiC (berikelse analyse av miRNA mål i Hierarkiske genet Co-uttrykk signaturer), kan antyde de forstyrrede miRNA regulatoriske nettverk i kreft ved å analysere enrichments av miRNA mål gensettene i de hierarkiske genet co-uttrykk signaturer. Disse gen signaturer ble etablert av hierarkisk gen co-uttrykk clustering, en vanlig måte å skille de blandede signalene i genuttrykk profiler på ulike korrelasjons nivåer. I miRHiC er miRNA målet genet sett ikke er nødvendig for å bli beriket i hele settet av forskjellig uttrykte gener, men innen noen signatur på fin skala av genet co-uttrykk hierarki. I tillegg til den høyere følsomhet for dedusere de onko-MIR kandidater, en annen fordel med tanke på genet koekspresjon informasjon er å redusere støy av dedusere de tilsvarende forstyrrede målgener: de «spredte» differensielt uttrykte gener med lite uttrykksmønster likhet med andre gener , noe som er mer sannsynlig å være «falske» miRNA mål på grunn av uttrykk lyder [13], er utelukket i løpet av analysen. På to store kreft genuttrykk datasett, miRHiC hell identifisert flere kjente onko-Mirs og også inferred mange nye kandidater.

Materialer og metoder

Mirna målgener

mirnas og deres mål gener (de mirnas fra samme familie er slått sammen som en enkeltartikler) ble hentet fra TargetScan database (v6.2) [1], [2]. Et gen ble betraktet som et mål for en miRNA, dersom genet inneholder minst et konservert forutsagte miRNA bindingssetet i sin 3′-UTR. Og oppsummert sammenheng score (en negativ score måle miRNA-target regulering styrke eller tillit, levert av TargetScan) ble registrert for hver miRNA-target par. Deretter diskretisert vi kontekst score i

K

nivåer: alle miRNA-target parene ble sortert i henhold til de kontekst score i synkende rekkefølge (parene rangert på toppen har den laveste regulering styrke) og diskretiserte score for miRNA-target par med rang

r

ble definert som:

s

= 1+

b product: [

rK Twitter /

N

]. Det betyr at første 1 /

K

miRNA-målet parene har lavest score ett, mens den siste 1 /

K

parene har høyest poengsum 1+

b plakater (

K

-1). Ifølge ref. [6],

K

er angitt som 5 og

b

som 3 i denne studien.

Kontroll miRNA målet gensettene generert av bipartite graf basert tilfeldig permutasjon av miRNA-target par med samme diskretisert score, men å holde størrelsen på alle mål gensettene. Denne typen strengere permutasjon prosedyren kan generere kontroll miRNA mål gensettene som bevarer de statistiske egenskapene mye bedre enn randomisering uten begrensning [6].

Kreft genuttrykk data

Vi tester miRHiC på to store kreft genuttrykk datasett som er lastet ned fra NCBI GEO database: 1) lungekreft (HiL) datasett, GSE19804 inkludert 60 sammenkoblede kreft og para-kreft prøver; og 2) hepatocellulær kreft (HCC) datasett, GSE22058 inkludert 96 parvise kreft og para-kreft prøver. For å unngå støy i ydmyk uttrykte gener, vi bare holdt gener hvis uttrykk verdier rangerer øverst 10.000 i minst 30% prøver i hvert datasett. Deretter ble de differensielt uttrykte gener identifisert med en p-verdi 0,0001 under anvendelse av t-test (p-verdiene var multippel testing justert ved korreksjon BH). Vi identifiserte 3,397 og 5,699 differensielt uttrykte gener for LUC og HCC datasett, henholdsvis

miRHiC. Berikelse analyse av miRNA mål i hierarkisk gen Co-uttrykk signaturer

miRHiC ble foreslått å utlede opprørt miRNA regulatoriske nettverk i kreft ved å innlemme den hierarkisk organisert co-uttrykk informasjon av forskjellig uttrykt gener: for det første ble de hierarkiske genet co-uttrykk signaturer etablert av clustering de differensielt uttrykte gener basert på parvise genet co-uttrykk sammenhenger; deretter miRNA målet genet sett berikelse ble analysert på tvers av hierarkiske co-uttrykk signaturer; og til slutt, en permutasjon test ble brukt til å estimere den statistiske signifikans av de anrikning (figur 1)

I det første trinnet ble de differensielt uttrykte gener gruppert som hierarkisk gen koekspresjon signaturer.; da var den viktigste berikelse av miRNA målet genet sett funnet på tvers av hierarkiske signaturer; og til slutt, en permutasjon test ble brukt for å estimere den empiriske p-verdien for berikelse.

1) Få de hierarkiske genet co-uttrykk signaturer.

For det første, gjennomsnittlig kobling hierarkisk clustering er iverksatt for å klynge de differensielt uttrykte gener basert på deres parvise co-uttrykk sammenhenger. For å redusere støy som forårsakes av dårlig korrelerte gener, er den hierarkiske clustering stoppet dersom genet koekspresjon korrelasjon er for lav: vi brukte korrelasjon med Z-score 0.52 som avskjæringen i denne studien (ca. p-verdi på 0,3; z- score på en gitt sammenheng nivå er beregnet ved hjelp Fisher transformasjon). Denne cutoff viser noen påvirkning på resultatene: for LUC datasettet, da z-stillingen cutoff endret 0,3 til 0,9 med trinn 0.1, ble det hierarkiske clustering stoppet ved nesten det samme sted. Deretter hentet vi genet co-uttrykk signaturer (stabil genet co-uttrykk klynger) på forskjellige korrelasjons skalaer ved å gå gjennom co-uttrykk hierarki fra blad til root (korrelasjonen er avtagende og størrelsen på signaturer er økende når man traverserer hierarkiet fra blad til root). Detaljene i signaturen utvinning algoritmen er gitt i bruksanvisningen via miRHiC hjemmeside.

2) Analyser miRNA målet genet sett enrichments i de hierarkiske genet co-uttrykk signaturer.

For

j

-te gen co-uttrykk signatur i hierarkiet, kan vi finne de overlappende gener mellom signaturen (betegnet som

S

j

) og

i Z – th miRNA målet genet sett (angitt som

T

i

), og deretter beregne rå berikelse poengsum ved å summere diskretisert TargetScan score (se detaljene i resultatet diskretisering i avsnittet over) av overlappes gener for

i

-te miRNA:

p-verdi

p

ij

for anriking ble beregnet ved å undersøke berikelse score

ES

ij product: (

r

) på 10.000 size-matchet tilfeldig kontroll miRNA mål gensettene:

Etter å ha fått enrichments i alle hierarkisk gen co-uttrykk signaturer (

j

= 1, 2, …),

P

-score

P

i

for

i

-te miRNA var beregnes som p-verdien av de mest betydningsfulle berikelse.

P

-score ble brukt til å måle miRNA målet genet berikelse i hele genet co-uttrykk hierarki

3) Beregn den statistiske betydningen av

P

-score Basert enrichments.

P

-score er minimal av et sett med p-verdier, slik det ikke er jevnt fordelt langs 0~1 (forspent til 0). Det kan ikke direkte brukes til å måle den statistiske signifikans av berikelse. Igjen, brukte vi permutasjon test for å beregne statistisk signifikans av P-score: P-score

P

i

(

r

) på 10.000 size-matchet kontrollgruppe miRNA målet genet settene ble beregnet i henhold til fremgangsmåten ovenfor; og den empiriske p-verdi

p

i

for P-stillingen

P

i

ble beregnet som:

Det empiriske p-verdi

p

i

ble anvendt for å måle den statistiske signifikans av miRNA målgen sett anrikning over hele hierarkiske gene koekspresjon signaturer. For å korrigere flere test, fdrtool ble brukt til å beregne

q

-verdier i henhold til de empiriske p-verdier [14].

Sammenligninger med andre metoder

miRHiC var sammenlignet med Gene Set Enrichment analyse (GSEA) og genet satt analyse av hyper geometrisk test (HG-test). GSEA er en mye brukt metode for å dedusere de forstyrrede gensettene ved å ta den kontinuerlige verdier og rang informasjon om differensial genekspresjon [5]. Når man sammenligner miRHiC med GSEA ble fold endringer av genekspresjon mellom kreft og normale prøver brukes i GSEA og samme miRNA målet genet sett permutasjon metoden ble brukt til å beregne de empiriske p-verdier.

GSEA og HG- test bruker forskjellige beregningsmodeller for å måle genet sett enrichments med miRHiC. For direkte teste fordelen med å bruke den hierarkiske genet co-uttrykk informasjon, brukte vi forskjellig uttrykt gener som eneste signatur og kjørte miRHiC på den. For klar presentasjon, oppkalt vi denne tilnærmingen som miRDeG (berikelse analyse av miRNA mål i forskjellig uttrykt gener).

Bortsett hierarkisk clustering,

k

en anordning clustering er en annen vanlig brukt algoritme for å generere genet co-uttrykk signaturer. Algoritmen kan partisjonere alle differensielt uttrykte gener i

k

ikke-overlappende klynger. I motsetning hierarkisk clustering,

k

en anordning er vanskelig å utelukke dårlig korrelerte gener ved å sette terskelen. I sammenligning brukte vi

k

en anordning (

k

er angitt til 5 eller 10) for å få genet koekspresjon signaturer. Deretter kjører vi samme fremgangsmåte for å analysere miRNA målet enrichments i de genererte signaturer med forskjellig

k

. Vi kalte denne tilnærmingen som miRKM (miRKM5 og miRKM10) i under pkt.

Resultater

estimere empiriske p-verdiene uten skjevhet ved miRHiC

For å demonstrere at miRHiC hadde ikke problemet med over-estimere de statistiske betydninger, genererte vi 100 size-matchet kontrollgruppe mål gensettene for hver miRNA, og deretter beregnet fordelinger av de empiriske p-verdier for sine enrichments i den hierarkiske genet co-uttrykk signaturer ved hjelp miRHiC . Dersom miRHiC har ingen vinkling for å estimere de empiriske p-verdier, bør de p-verdier på disse styre miRNA mål gensettene bli jevnt fordelt mellom 0~1. Som ventet, viste resultatene at de empiriske p-verdiene er jevnt fordelt (figur 2). En annen mulig skjevhet påvirker empirisk p-verdi er forårsaket av forskjellige størrelser av miRNA mål gensettene: noen mirnas har mer enn 1000 mål gener, mens noen bare har mindre enn 50 mål gener. Vi beregnet Spearmans rang korrelasjon mellom størrelser og de tilsvarende empiriske p-verdiene til de gensettene. Korrelasjonen er -0,015 (p-verdi på denne korrelasjonen 0,05), som foreslo at de empiriske p-verdiene ikke blir påvirket av størrelsen på gensettene. Basert på disse analysene, kan vi konkludere med at miRHiC har ingen vinkling for å estimere de empiriske p-verdier.

inferring de forstyrrede miRNA regulatoriske nettverk i kreft

miRHiC kan antyde onko-Mirs og deres opprørt mål regulatoriske nettverk ved å analysere miRNA målet genet sett berikelse i hierarkiske genet co-uttrykk signaturer i kreft. På de to store genuttrykk datasett av lungekreft (HiL) og hepatocellulær kreft (HCC), miRHiC utledes 9 og 8 opprørt mirnas eller onko-Mirs henholdsvis med q-verdi under 0,1. Under den samme q-verdi cutoff, de tre sammenlignet metoder, GSEA, HG-test og miRDeG ikke antyde noen kandidat. Selv miRKM utledes noen kandidater (for LUC datasett, miRKM5 /10 inferred 3/4 kandidater, og for HCC datasett, miRKM5 /10 inferred 6/3 kandidater), disse tallene er fortsatt mindre enn miRHiC og de fleste av miRKM slutninger er dekket av miRHiC. Detaljene Resultatene er gitt i tabell S1. Blant alle 17 slutninger fra miRHiC er 9 støttes av direkte funksjonelle bevis i litteraturen (LUC: Mir-26, MIR-29, MIR-125, MIR-130, MIR-145 og MIR-200; HCC: Mir-21, MIR -124 og MIR-125). Disse resultatene indikerer at miRHiC kan forbedre følsomheten onko-MIR slutninger (tabell 1). Tatt i betraktning den heterogeniteten av kreft transkriptomet, ble bootstrapping resampling gjennomført for å undersøke stabiliteten av de slutninger. For HiL, kan seks av ni kandidater gjentatte ganger utledes i mer enn 50% resampling eksperimenter (MIR-125, MIR-149, MIR-340 og MIR-200 er stabilt inferred i mer enn 80% eksperimenter). For HCC, 5 av 8 kandidater kan gjentas utledes (MIR-125 og MIR-149 er stabilt utledes i mer enn 60% eksperimenter).

Ved å se på målrettede skriftene til inferred onco -miRs, fant vi at de har ulike nivåer av genet co-uttrykk i hierarkiene (figur 3). Funksjonene forbundet med disse signaturene (de beriket GO form av underskriftene ble kommentert av DAVID web verktøy [15]) er signifikant relatert til ulike kjennetegn kreft, inkludert cellesyklus, oksidasjon reduksjon, immunrespons, DNA-reparasjon, celle adhesjon og blodkar utvikling (tabell 2). Disse resultatene indikerer at mange mirnas er knyttet til kreft gjennom forskjellige underreguleringsprogrammer. For eksempel, er MIR-200 er kjent som en viktig regulator av angiogenese (a barn sikt av «vaskulatur utvikling»). Det er flere eksperimentelle validerte mål gener for angiogenese, inkludert ZEB1 og KDR [16], [17], [18] som finnes i den antatte perturbed MIR-200 regulatoriske nettverk i LUC datasett. MiR-200 kan regulere angiogene bryter i lungekreft gjennom disse målgener. I leverkreft, ble Mir-21 spådd å regulere «immunrespons» ved å målrette CD69, STAT3, CCL20 og SMAD7, der STAT3 og SMAD7 er viktige signalmolekyler for immunrespons.

A) er for lungekreft og B) for leverkreft. Sirkelen nodene representerer genet co-uttrykk signaturer (ClusterId: Size). Diamant nodene representerer de utledede Onco-Mirs. Tallene på kantene representerer størrelsen på miRNA målgener overlappet med de tilsvarende genet co-uttrykk signaturer.

opprørt MIR-149 sub-nettverk som deles av de to typer kreft

De Onco-Mirs inferred i flere kreftformer kan spille flere viktige roller i kreft initiering og utvikling. To mirnas, MIR-125 og MIR-149 ble utledet av miRHiC i begge typer kreft. For den antatte opprørt MIR-125 regulatoriske nettverk, er det bare tre felles mål (CDK16, TOMM40 og KIAA1522), noe som tyder på at Mir-125 kan regulere ulike veier i de to typer kreft. Mens for MIR-149, dets forstyrrede regulatoriske nettverk vise betydelig mål overlappende med felles sub-nettverk inkludert 14 felles mål. Og de 14 målene er gjennomgående over-uttrykt i kreftvevet (figur 4).

De gjennomsnittlige tømmer-transform fold endringer av felles mål gener er også vist i tabellen under.

MiR-149 er et pattedyr konservert miRNA. Noen studier viser at MIR-149 genetiske polymorfismer er forbundet med risiko for kreft [19], [20]. Dens uttrykk er epigenetisk brakt til taushet av DNA hyper-metylering i kolorektal kreft [21]. Men Mir-149 regulatoriske nettverk er fortsatt dårlig forstått i kreft. Antatt forstyrrede nettverk gir viktig innsikt fra Mir-149 forskrifter: de fleste av de høye tillit mål (med høye TargetScan score) i den delte sub-nettverk er knyttet til noen essensielle biologiske prosesser, slik som SRPK1 (serin /arginin-rik spleising faktor kinase 1) og CCT3 (chaperonin inneholder TCP1, subenheten 3). SRPK1 koder for en serin /arginin-protein kinase som er spesifikke for SR (serin /arginin-rikt domene) familie av spleise faktorer. SRPK1 er oppregulert i lungekreft og mange andre krefttyper [22], [23]. CCT3 er en subenhet av en molekylær anstand protein (chaperonin innehold TCP1 kompleks) hjelpende fold aktin /tubulin og det kan positivt regulerer cellesyklusen [24], [25]. CCT3 over-uttrykk er også rapportert å være relatert til tykktarmskreft [26] og leverkreft [27]. Så kan MIR-149 fungerer som en kreft demper ved å målrette disse onkogener.

Diskusjoner

Analysere miRNA målet genet sett berikelse i forskjellig uttrykt gener av store genuttrykk profiler kan i stor grad fremme vår forståelser av forstyrrede miRNA bestemmelser. Men på grunn av kompleksiteten av kreft transkriptomet, er det en utfordring å utlede de forstyrrede miRNA forskrifter ved ganske enkelt å analysere miRNA målgenet satt anrikning i hele differensielt uttrykte gener. I denne studien har vi utviklet miRHiC å antyde de forstyrrede miRNA regulatoriske nettverk i kreft ved å innlemme den hierarkiske genet co-uttrykk informasjon i miRNA målet genet sett berikelse analyse. Resultatene viste at miRHiC har mye høyere følsomhet for de slutninger enn de mest brukte metoder, som HG-test, GSEA og miRDeG (FAME), hvorav alle ikke bruker den hierarkiske genet co-uttrykk informasjon. Over 50% av inferred Onco-Mirs har omfattende litteratur støtter og gense co-uttrykk signaturer målrettet av disse mirnas er signifikant relatert til flere kjennetegn på kreft. Nyere studier viser også at genet co-uttrykk kan gi viktig informasjon for å identifisere de «ekte» målgener av mirnas i tilsvarende biologiske prosessen [13], [28], noe som tyder på at målet gener overlappet med beriket co-uttrykk signaturer er mer sannsynlig de virkelige mål i kreft. Selv miRHiC forbedret sensitivitet for å utlede onko-Mirs og deres forstyrrede mål nettverk, noen kjent onko-Mirs, slik som MIR-126 i lungekreft og MIR-122 i leverkreft, ble savnet. Disse tapte saker tyder på at andre beregningsmodeller må utvikles for å identifisere onko-Mirs hvis regulatoriske nettverk kan ikke forklares med målgenet enrichments i differensial genekspresjonssignaturer.

De lengder av 3′-UTR er sterkt korrelert med antall målrettede miRNAs og kontekst score. De beriket signaturer kan betydelig være partisk til de med lengre 3′-UTR. Ved bruk av hyper-geometri test for å analysere enrichments av miRNA mål gensettene, fant vi at signaturene målrettet av de utledede mirnas har mye lengre gjennomsnittlig lengde på 3′-UTR. Men som FAME [6], miRHiC brukte bi-partite graf basert permutasjon metode, som i stor grad kan redusere denne skjevheten: gjennomsnittlig lengde på 3′-UTR av genene i underskriftene målrettede av inferred Onco-Mirs er 1314 nt og 1449 nt for LUC og HCC datasett, henholdsvis ikke lenger enn disse lengdene av forskjellig uttrykte gener (1424 nt og 1470 nt, henholdsvis).

miRHiC gir en generell strategi for å analysere miRNA bestemmelser hjelp hierarkiske signaturer . Ulike hierarkiske clustering metoder kan anvendes for å få de hierarkiske gene expression ko-signaturer. Foruten genet co-uttrykk, kan de funksjonelle og regulatoriske interaksjoner mellom gener (for eksempel protein-protein interaksjoner, transkripsjons forskrifter og litteratur co-forekomster) videre integreres å etablere hierarkiske gen signaturer. Vi vil kontinuerlig teste miRHiC strategi ved hjelp av ulike typer implementasjoner.

For å få bedre kontroll sett av miRNA mål gensettene, miRHiC brukte bi-partite graf basert permutasjon. Men dette permutasjon metoden er tidkrevende. Dessuten er det beregningsbelastningen høy for å beregne de empiriske p-verdiene i en nestet måte på tvers av de hierarkiske gene expression ko-signaturer. Vi planlegger å utvikle raskere algoritme for å redusere overflødige beregninger for å estimere p-verdiene i fremtiden.

Hjelpemiddel Informasjon

Tabell S1.

De detaljerte resultatene av miRHiC, GSEA, HG-test, miRDeG og miRKM

doi:. 10,1371 /journal.pone.0081032.s001 plakater (XLSX)

Takk

Vi takker Dr Xiaotu Ma og professor Yanda Li for omfattende diskusjoner. Vi takker Rui Fu og Chao han for programvareutvikling og validering.

Legg att eit svar