Abstract
microRNAs (mirnas) er små regulatoriske RNA som fungerer ved å blokkere oversettelse og øker nedbrytningen av målet transkripsjoner. Mirnas spille en avgjørende rolle i mange biologiske prosesser, inkludert utvikling og differensiering, og mange studier har vist at store endringer i miRNA nivåer forekommer i kreft. Siden mirnas degradere mål meldinger, vi brukte denne egenskapen til å utvikle en ny beregningsmåte som tar sikte på å bestemme den faktiske biologiske aktiviteten av miRNAs bruker variasjoner i genuttrykk. Ved hjelp av metoden beskrevet her, kvantifiseres vi miRNA aktivitet i papillær skjoldbruskkjertelen carcinoma og brystkreft, og fant en sterk og særpreget signal om økt global miRNA aktivitet, forankret i de tilhørende genuttrykk målinger. Interessant nok har vi funnet at i disse to kreftformer, er miRNA aktivitet globalt økt, og er forbundet med en global nedregulering av miRNA målgener. Dette downreguation av miRNA regulerte gener er spesielt merkbart for gener som frakter flere mål nettsteder for miRNAs. Blant de miRNA-trykt gener, fant vi en betydelig berikelse av kjente kreftdempere, og dermed tyder på at den økte miRNA aktiviteten var faktisk tumorigent
Citation. Israel A, Sharan R, Ruppin E, Galun E (2009) økt mikroRNA i menneskelig kreft. PLoS ONE 4 (6): e6045. doi: 10,1371 /journal.pone.0006045
Redaktør: Joseph Alan Bauer, Bauer Research Foundation, United States of America
mottatt: 9 februar 2009; Godkjent: 26 mai 2009; Publisert: 25 juni 2009
Copyright: © 2009 Israel et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. AI er støttet av en bevilgning fra Fondation Erich et Regine Loewenthal. EG er støttet av den israelske departementet for vitenskap, gjennom en bevilgning til Nasjonalt Gene Therapy kunnskapssenter og gjennom EU bevilger LSHB-CT-2004-512034 (MOLEDA), LSHB-CT-2008-223317 (Liv-ES), og LSHB -CT-2005-018961 (INTHER). EG er også støttet med tilskudd fra Blum, Harold Grinspoon, Barbara Fox Miller støtte, Horowitz og Wolfson Foundations. RS og ER er støttet av et forskningsstipend fra departementet for vitenskap og teknologi, Israel. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
microRNAs er enkeltrådet ikke-kodende RNA-molekyler av omtrent 22 nukleotider som parer med messenger RNA (mRNA) som bærer en komplementær sekvens [1]. MicroRNAs binde seg til målet mRNA innenfor RNA-induced Slå kompleks (RISC), som inneholder et medlem av argonaute protein familien. Denne binding hindrer translasjon og akselererer nedbrytningen av de målrettede mRNAer [2]. I de siste årene har mirnas vist seg å spille en viktig rolle i reguleringen av genekspresjon, og det er dokumentert at mirnas er involvert i sentrale biologiske prosesser, herunder utvikling, organogeneseperioden, vev differensiering, cellesyklus, og metabolisme [3 ] – [5]. Bemerkelsesverdig, er romlig og tidsmessig uttrykk for miRNAs karakteristisk for vev og utviklingsstadier, og flere studier har vist en sammenheng mellom mirnas uttrykt i spesielle vevstyper og regulering av vevsspesifikke gener [6].
Endringer i miRNA ekspresjon er vist å forekomme i kreft [7] imidlertid, naturen og virkningen av de fleste av disse endringene er fortsatt uklar. Spesielt, motstridende funn eksisterer over spørsmålet om miRNA nivåer er globalt redusert eller økt i kreft. Modne mirnas har vist seg i noen studier for å bli redusert i kreft [8], mens andre studier har oppdaget at oppregulering av mirnas i mange tumorer [9]. En mulig forklaring på disse sprikende funnene kan være forskjeller mellom tumortyper, vev analysert, eller til og måleteknikk. En annen antatte forklaring er at dereguleringen som mirnas gjennomgå i kreft er en kompleks prosess. Det vil si at resultatet av miRNA regulering av genekspresjon er avhengig ikke bare av nivåene av de mirnas, men også av en rekke andre faktorer som medierer påvirkning av mirnas på deres målgener, slik som komponenter av RISC-komplekset. Følgelig kan tilgjengeligheten av disse faktorene markert modulere den samlede påvirkning av mirnas effekt på deres målgener, og, som et resultat, gir ytterligere tilbakemelding på nivåene av mirnas seg selv. Slike globale variasjoner av miRNA aktivitet er foreslått av studier som har vist at Argonaute2 (
EIF2C2
) genet, som er innlemmet i den RISC komplekse, ofte duplisert i tumorer [10]. Siden dette genet ikke er direkte involvert i miRNA biogenesis, kunne man forvente at når dette genet er duplisert, vil nedbrytning av miRNA målgener øke, uten tilhørende økning i miRNA nivåer. Av denne grunn er det forsøkt å bestemme den samlede effekten av mirnas på deres målgener, deres
biologisk aktivitet
, og utviklet en metode for måling av denne effekt direkte fra de tilhørende mål-genet ekspresjonsnivåene.
Vår metode, kalt Mira (mikroRNA aktivitet basert på ekspresjonsnivåer), er basert på den observasjon at mirnas er kjent for å akselerere nedbrytningen av sine mål transkripter, og at denne aktiviteten etterlater en signatur på at mRNA-nivåene av deres målgener. En reduksjon i uttrykket nivåer av mRNA som bærer et bindingssete for et miRNA art kan påvises ved transfeksjon med de beslektede mirnas [11]. I tillegg har flere studier vist en klar sammenheng mellom mirnas som er høyt uttrykt i et gitt vev og nedregulering av sine mål transkripsjoner [6], [12], [13]. Dermed er en forskyvning av uttrykk av settet av gener målrettet av en miRNA i en prøve en indikasjon på at den biologiske aktiviteten til en tilsvarende miRNA arter endringer i dette utvalget.
Mirabelle tilnærmingen bygger på prinsippet om at genet uttrykket nivåer reflektere regulerende effekt av høyere orden moduler, og derfor kan man vurdere effekten av disse modulene, ved å observere transkripsjons endringer [14], [15]. Spesielt har nylige rapporter vist at variasjon i aktiviteten av mirnas kan påvises ved å sammenligne nivåene av miRNA målgener på tvers av ulike vev [16], [17]. Vår metode, men lignende i sitt konsept, avviker fra tidligere publiserte tilnærminger i at det er utformet for å fange opp karakteristiske trekk ved miRNA regulering på mRNA transkripter.
Det er allment akseptert at miRNA binding er hovedsakelig bestemt av tre » uoversatt region (UTR) av mRNA. Tilstedeværelsen av en 7-mer komplementært til en miRNA frø (nukleotidene 2-8) i det 3′-UTR fra et gen som er en nøkkelfaktor for miRNA gjenkjennelse; og flere algoritmer som TargetScan [18], [19], har lykkes å identifisere miRNA-genet foreninger ved å nøye identifisere gener med konserverte sekvenser som tilsvarer Mir anerkjennelse mønstre. Ikke desto mindre, har en etablert forbindelse mellom et miRNA og et målgen ikke at alle transkripter fremstilt fra dette genet ville bli utsatt for miRNA regulering. Omtrent halvparten av menneskets gener kan gjennomgå polyadenylation på flere steder, eller være gjenstand for alternativ spleising påvirke deres siste eksoner [20], [21], og dermed produsere utskrifter som avviker i sine 3 «UTR sekvenser. Blant mRNA transkribert fra slike loci, bare de som bærer miRNA anerkjent sekvens mellom stoppkodon og polyA hale ville bli påvirket av miRNA regulering. Denne egenskapen, skiller bemerkelsesverdig miRNA virkning fra transkripsjonen regulering skjer på genpromoteren området, og som påvirker alle isoformer av genet. Vi brukte denne egenskapen til å designe en metode som spesifikt vil vurdere effekten av miRNA regulering.
Denne tilnærmingen er gjort mulig av det faktum at noen microarray plattformer, som Affymetrix, måle avskrift overflod ved hjelp av flere sekvenser tatt fra tre «ende av genet. Affymetrix genekspresjon data er oppsummert i probe-sett, og det finnes flere probe-sett som er tilgjengelige for de fleste genene. Noen av disse probe-sett er pålitelige indikatorer på miRNA aktivitet, noe som betyr at de oppdager sekvenser som bare kunne vises i isoformer av et gen som inkluderer et bindingssete for en gitt miRNA: alle transkripsjoner oppdaget av disse probe-sett ville være påvirket av en endring i aktiviteten til et gitt miRNA. Det første trinn i vår analyse var således til å identifisere disse probe-sett og mirnas hvor de registrerer aktivitet. Vi gjorde dette ved å kartlegge sekvensen av sondene, og bestemme deres posisjon i genet med hensyn til miRNA målseforutsagt for genet.
Mira bruker uttrykket verdiene målt ved disse probe-sett for å beregne en biologisk aktivitet poengsum for hver miRNA frø. I utgangspunktet, det tar som input en genuttrykk datasett og sammenligner, i hver prøve, uttrykket nivåer av probe-sett som er pålitelige indikatorer for aktiviteten til en gitt miRNA seed «Mir-frø», med uttrykket nivåer av andre probe-sett til stede på matrisen, som tjener som referanse. Utgangen av Mirabelle er en «MIR aktivitet matrix», som gir aktivitets score for hvert miRNA familie (identifisert av frø sekvens), og hver prøve. Ved konvensjonen, er positive skårer gis når målene for en miRNA familie skjerm downregulation, noe som indikerer at den biologiske aktiviteten av beslektede mirnas økes i prøven, mens negative verdier oppnås for oppregulering av mål, noe som tyder på en redusert aktivitet.
Metoder
Mirabelle verktøy
Mirabelle tar som input et uttrykk datasett og produserer en MIR-frøaktiviteten matrise, gir for hver prøve i datasettet, aktivitets score beregnes for hver av miRNA arter som spådommer eksisterer. Positive verdier oppnås når mål for en gitt MIR-frø skjerm mer nedregulering enn referanse, noe som indikerer at aktiviteten av denne MIR-frø er økt i prøven, mens negative verdier oppnås for oppregulering av mål, noe som tyder på en redusert aktivitet. Dette verktøyet er skrevet i Perl.
MiR-frø aktivitet poengsum beregning
Mirabelle første standardiserer genuttrykket nivåene rapportert i inngangsdatasettet ved hjelp av Z-score, for å korrigere for ulik følsomhet av sonde -sets, og misforhold mellom gjennomsnittlig nivå av transkripter som er tilstede i vevet. Deretter bruker den t-statistikken til å beregne aktivitets score, sammenligne, i hver prøve, Z-score av probe-sett som er pålitelige detektorer av en gitt MIR-frø, med Z-score til andre probe-sett. Vi brukte to-tailed, to-utvalgs t-statistikken, med ulik varians (to sample Welch t-statistikken). På en tilfeldig stokket genekspresjon datasettet, variansen til denne statistikken er en, og fordelingen er normalt når basert på minst 20 detector probe-sett.
Mirna rettet spådommer
I denne studien brukte vi TargetScan 4,0 spådommer (juli 2007) av miRNA mål [18], [19]. TargetScan 4.0 bruker både evolusjonære bevaring, og spesifikke kontekst determinants å forutsi miRNA mål. Targetscan 4,0 spådommer er tilgjengelig for ca 158 forskjellige konserverte miRNA frø, representerer ca 450 modne mirnas i det menneskelige. Blant disse MIR-frø, ble fire pålitelig oppdaget av mindre enn 20 probe-sett i microarray, og ble dermed ekskludert fra analysene.
Kartlegging av probe-sett til Mir-frø
i Affymetrix genekspresjon mikromatriser, er det vanlig å ha flere probe-sett for det samme genet, som hver gjenkjenner en forskjellig sekvens. Ifølge plasseringen av sekvensene gjenkjent av probe-sett, er det mulig å bestemme hvorvidt en gitt probe-sett oppdager bare isoformer som bærer en MIR-frø målområde, eller også isoformer som kan være unntatt fra MIR-frø målområde . Probe-sett oppdage utelukkende transkripsjoner bærer en MIR-seedet mål er sterkere påvirket av miRNA regulering enn probe-sett som gjenkjenner en region av genet deles av vitnemål som ikke bærer Mir målsekvensen. Dermed en tidligere skritt til vår analyse var å tildele hver probe-sett tilgjengelig på microarray en liste over MIR-frø som vil påvirke alle isoformene oppdaget av sonden-settet. Vi brukte følgende regel for tilordning av probe-sett for å MIR-frø: når den sekvensen som tilsvarer en gitt MIR-frø er direkte gjenkjent av en probe-sett eller befinner seg oppstrøms til sekvensene som detekteres av sonden-set i genet og på samme ekson, anser vi dette probe-satt til å være en pålitelig indikator på aktiviteten for denne MIR-frø. Men hvis sekvens som tilsvarer denne MIR-frø ligger nedstrøms til sekvensene anerkjent av sonden-set, kan sonden-settet oppdage korte mRNA som ikke inneholder noen miRNA målwebområder, og vi trenger ikke tilordne den til Mir -frø. Vi utførte denne kartleggingen ved hjelp av genomet leseren database UCSC [22], menneskelig build 17 (https://genome.ucsc.edu). Vi lastet ned de TargetScan spådommer fra nettsiden (https://www.targetscan.org) og kartlagt dem til UCSC genom; Vi brukte «knownGene» table for kartlegging kromosom steder til gener; Vi brukte «affyU133Plus2» og «affyU133» tabeller for å finne plasseringen av sekvenser som gjenkjennes av probe-sett i genene (Tekst S1).
datasett analysert
Pappilary thyroideakarsinom og brystkreft datasett ble hentet fra GEO databasen [23], tiltredelse GSE3467, GSE3744, og ArrayExpress database [24], tiltredelse E-MEXP-882. Vi brukte de normaliserte uttrykk verdier fra databasen. Når rå data var tilgjengelig, vi lastet det ned, og renormalized den ved hjelp GCRMA, RMA og MAS 5,0 pakker på Bioconductor [25]. Mirabelle spådommer og berikelse av downregulated mål ble ikke signifikant påvirket av normalisering algoritmen som brukes. Validering eksperimenter av transfeksjon med microRNAs og antagomirs ble hentet fra GEO database, tiltredelse GDS1858, GDS2657, og GSE3425.
TF berikelse analyse
bindingsseter (BS) for TF ble bestemt ved å skanne promotere til alle probe-sett som er tilstede i Affymetrix microarray for fyrstikker med Transfac matriser, som beskrevet i [26]. I hver promoter, ble de 500 basepar (bp) umiddelbart før transkripsjonsstartsetene skannet, i samsvar med det faktum at de fleste aktive TFBS synes nær transkripsjonsstartsetet [27]. Den hypergeometriske fordelingen ble brukt for å vurdere berikelse mellom bakgrunnen sett probe-sett og et prøvesett.
GO Stempler
Vi brukte GO biologisk prosess merknader for U133Plus2 utvalg fra Affymetrix hjemmeside ( https://www.affymetrix.com).
statistikker
Vi brukte to-tailed, to-utvalgs t-test med lik varians for å identifisere de Mir-frø som viser mest signifikante avvik i tumorer sammenlignet med normalt vev, og rangert disse Mirs i henhold til denne testen. Denne test ble utført i Excel. Vi utførte en prøve Kolmogorov-Smirnov (KS) tester for å vurdere normalitet av fordelingen av MIR aktivitets score beregnet av Mirabelle på datasettet, og to-utvalgs KS tester for å sammenligne distribusjoner av Mir aktivitet score beregnet fra den opprinnelige og en tilfeldig stokket datasett. KS tester og tilhørende histogrammer ble utført i Matlab 7 (Mathworks). De berikelse testene ble utført med den hypergeometriske kumulative fordelingsfunksjonen i Matlab.
Anriking av downregulated gener med økende antall MIR målse (tabell 1)
For gitt sett av MIR -seeds utførte vi berikelse tester iterativt for hver
i
mellom 0 og maksimalt antall målse, som følger. Den totale bestandsstørrelsen (N) var antall informative probe-sett som har minst
i
målrette nettsteder for ansett sett MIR-frø, ble antall probe-sett rapportering downregulation regnes som suksesser (m ). Vi testet for anriking av nedregulering i utvalget av probe-sett oppdager minst
i + 1
målwebområder for disse Mir-frø.
Anriking av GO kommentarer (tabell S6)
Vi brukte hyper-geometrisk distribusjon for å identifisere de mest betydelig anriket merknader i utvalget av 9542 probe-sett forbundet med de 77 Mir-frø, med hensyn til befolkningen i alle probe-sett på array (A). 5069 av disse MIR mål ble effektivt nedregulert i svulster. I den andre analysen identifiserte vi de betydelig anriket merknader i utvalget av 5069 downregulated probe-sett, med hensyn til befolkningen i 9542 spådde mål (B).
Resultater
Validation av Mirabelle Method
Vi først validert Mirabelle metoden i vev der overflod av en spesiell miRNA hadde blitt eksperimentelt økt. Lim et al. [11] transfektert HeLa celler med MIR-124, MIR-1 og MIR-373, og målt genekspresjon etter 12 og 24 timer. Wang et al. [28] transfektert HepG2-celler med MIR-124 og målt gen-ekspresjon ved forskjellige tidsintervaller. Vi utsettes de genuttrykk data i Mirabelle analyse, som beregnes Mir-frø aktivitet for hver prøve. I de prøver som ble transfektert med microRNAs, vår verktøyet korrekt identifisert meget betydelige økninger i mikroRNA aktivitet, spesielt for MIR-frøene MIR-124, MIR-1, og MIR-373, i de tilsvarende forsøk (Text S1). For å sikre at Mira er egnet for deteksjon av endringer i miRNA aktivitet forekommende
in vivo
, analyserte vi genuttrykk data generert i eksperimentet av Krutzfeldt et al., Hvor MIR-122 ble brakt til taushet ved systemisk injeksjon av en antagomir [29]. Vi fant at våre verktøy korrekt identifisert betydelig reduksjon av aktivitet for MIR-122 som forekommer etter behandling med antagomir (Tekst S1).
inferring mikroRNA aktivitet i Human Papillary thyroideakarsinom
Papillary thyroideakarsinom (PTC) er en ondartet sykdom som står for ~80% av menneskelige skjoldbrusk kreft. To uavhengige studier har rapportert spesifikke endringer av miRNA nivåer i PTC. Det var derfor interessant å kvantifisere den biologiske aktiviteten av miRNAs i PTC hjelp av Mirabelle verktøy og sammenligne disse med endringene i miRNA uttrykket nivåer rapportert i disse to studiene.
Han et al. [30] målt miRNA nivåer i vevsprøver fra 15 PTC pasienter som bruker miRNA mikromatriser. Samtidig, de brukes også Affymetrix mikromatriser å bestemme genekspresjon i ni svulster (T-PTC) og ni sammenkoblede omliggende vev (N-PTC). Vi analyserte genuttrykk data ved hjelp av Mirabelle å antyde en MIR-frøaktiviteten matrise (tabell S1). Som det fremgår av denne tabellen, MIR-frø aktivitet score var betydelig høyere i tumorer enn i normalt vev, noe som tyder på at PTC svulster er preget av en intensivering av miRNA aktivitet. Faktisk median miRNA aktivitet score i svulster er høyere enn medianen aktivitet score i normale prøver for 97% av MIR-frø. For å bestemme Mir-frø som økningen av aktiviteten er størst i svulster, brukte vi to-utvalgs t-test for å sammenligne aktivitet skårer oppnådd fra normale og tumorprøver (tabell S2). Han et al., Rapporterte at MIR-146, MIR-221, MIR-222 og MIR-21, vises det mest dramatiske overekspresjon i tumorer med nivåer 19- til fire ganger høyere i tumorer enn i tilstøtende vev. T-testen anvendt på våre aktivitets score (ved hjelp av bare undergruppe av frø som ble brukt av He et al., I sin mikroRNA array) har fått identifisert de 3 Mir-frø som tilhører disse 4 microRNAs blant de seks mest betydningsfulle
p
-verdier (av 65 forskjellige frø). Dermed i PTC fall de beste MIR-frø er identifisert av sin biologiske aktivitet sammenfallende med de beste overuttrykte mirnas.
Kampen mellom våre spådommer og de biologiske målinger er ikke tilfeldig, og som vi viser nedenfor, resultater fra et meget sterkt signal til stede i genekspresjon. Aktivitets score beregnet av den Mira verktøyet er basert på t-statistikk, og i fravær av en felles regulering av disse genene, slik statistikk følge en normalfordeling. Figur 1A viser fordelingen av MIR-frø aktivitet score i normale og tumorvev. Det kan sees at aktiviteten score er betydelig høyere i tumorer enn i normalt vev (
p
10
-125 av en Kolmogorov-Smirnov (KS) test). Som en kontroll ble beregnet vi skårer hypotetiske aktivitet på det samme datasettet etter tilfeldig stokking av sonde-sett (fig. 1B). I sistnevnte tilfelle, vil ikke KS testen ikke påvise en signifikant forskjell mellom fordelingen av aktivitets score i tumor og normalt vev, som man ville forvente.
(A) Histogram som viser fordelingen av MIR-frø aktivitet score beregnet for tumor (rød) og normale prøver (cyan) i papillær thyroideakarsinom datasett. Aktivitet av miRNAs er globalt høyere i tumorvev i forhold til normalt vev. KS testen avviser hypotesen om likestilling mellom distribusjoner av aktivitets score i svulsten og i normalt vev, med en p-verdi P≈10
-126. Normalitet av aktivitets score er avvist med P 10
-300. (B) For å vise at avviket mellom scorene beregnet for normale og tumorvev er ikke på grunn av vår metode for beregning av aktivitets score, beregnet vi disse score fra en tilfeldig permutasjon av sonde-sett fra PTC datasett. For både normale og tumorvev, aktivitets score følger omtrent en normalfordeling, som forventet for en t-statistikken. Det er ingen observerbar avvik mellom tumor og normalt vev, og KS testen ikke avviser likestilling mellom de to fordelingene. (C) Histogram som viser fordelingen av MIR-frø aktivitet score beregnet for svulst (rød) og normale prøver (cyan) i brystkreft datasett. Mirna aktivitet er vesentlig høyere i tumorvev, i forhold til normalt vev. KS testen avviser hypotesen om likestilling mellom distribusjoner av aktivitets score i svulsten og i normalt vev, med en p-verdi P 10
-298. (D) Histogram som viser fordelingen av MIR-frø aktivitets score etter en tilfeldig permutasjon av sonde-sett fra brystet datasett.
inferring mikroRNA aktivitet i brystkreft
Etter å ha funnet som mikroRNA aktivitet er globalt økt i papillær thyroideakarsinom, fortsatte vi å undersøke miRNA aktivitet i brystkreft, som er den nest vanligste krefttypen, og en gjenstand for omfattende studier på genekspresjon, med noen svært verdifulle datasett tilgjengelig på felles repositories . Richardson et al., Publisert en genekspresjon studie på brystkreft [31], som er basert på et datasett som inkluderte sju normale vevsprøver og 40 brystsvulster, hvorav 18 var basal-lignende kreft (BLC), en dårlig differensiert og svært aggressiv form for kreft. Aktiviteten matrise utledet for dette datasettet vises i Tabell S3. Som vist i figur 1C, nivået av miRNA biologisk aktivitet i tumorprøver er her også signifikant høyere enn i normale prøver; KS test viser at aktivitets score i tumor og normale prøver har en klar fordeling (
p
10
-298). Sammenligning av medianaktivitets score i kreft og prøver normalt vev, alle unntatt fire Mir-frø ser ut til å ha høyere aktivitet i kreft enn i normalt vev. Selv etter å ha valgt en restriktiv cut-off av
p
3 · 10
-4 (tilsvarende en 0,05 betydning nivå etter en Bonferroni korreksjon for multippel testing), finner vi at 77 (ut av 150) MIR-frøene har en betydelig økt aktivitet i tumorer (tabell S4). Til sammen blir microRNAs svarer til disse 77 Mir-frø spådd av TargetScan å regulere ca 6000 gener. Den økte miRNA aktivitet observert er faktisk gjenspeiles i en markert nedgang i ekspresjon av disse målgener. Ut av de 9,542 probe-sett forbundet med transkripsjoner regulert av en av disse 77 MIR-frø, 5069 (53,1%) har lavere gjennomsnittlig uttrykk i tumorer (dvs. er de tilsvarende målgener nedregulert) enn i normalt vev, sammenlignet med 41,6% av alle de 40,539 probe-sett i rekken (
p
10
-147 av en hypergeometrisk test, figur 1)
for å gi ekstra støtte for vår konklusjon at microRNAs. er hovedårsaken til den massive nedregulering av disse genene, undersøkte vi omfanget av genet mål nedregulering som en funksjon av antallet av de tilhørende bindingssetene for de MIR-frø. Denne undersøkelsen har vært motivert av tidligere observasjoner som tyder på at mRNA degradering etter binding av miRNA er mer effektivt for utskrifter som frakter flere målområder for mirnas [32] – [34]. Tabell 1 oppsummerer uttrykk trendene som observeres for probe-sett som er tilordnet de 77 Mir-frø som viser den mest betydelige økningen av aktivitet i svulster. Som nevnt ovenfor, 9,542 probe-sett detektere transkripter som har minst ett bindingssete for Mir frø, 53,1% av dem viser nedregulering i tumorer. Når en vurderer de 6,574 probe-sett oppdager transkripsjoner med minst 2 målse, forbedrer prosentpoeng til 54,4% (p 1,3 · 10
-4 av en hypergeometrisk test), og det fortsetter å øke for probe-sett oppdager transkripsjoner bærer flere steder for miRNA bindende, og nådde ca 70% for de 228 probe-sett detektere vitnemål med mer enn 15 mål nettsteder. Det er bemerkelsesverdig at selv om MIRABELLE algoritme ikke bruke antall miRNA bindingsseter i sine beregninger-aktivitets score ble beregnet fra probe-sett identifisert som indikatorer på en MIR-frø, uavhengig av antall bindingssteder de kan bære den mirnas som ble identifisert som gjennomgår en vesentlig endring aktivitet, viste en klar dose-responseffekt. Derfor gir den gradvise økningen i andelen downregulated gener med antall målse sterk støtte til ideen om at redusert uttrykk av målgener er faktisk på grunn av økt miRNA aktivitet.
Siden mange gener er regulert av flere miRNA arter, ønsket vi å sikre at det oppdagede globale nedregulering av miRNA målgener var ikke på grunn av økningen i bare noen få bestemte arter av mirnas (som deler målgener med den andre miRNA arter) ut av dette settet med 77 aktive MIR -seeds. For å oppnå dette, utførte vi den hypergeometriske berikelse testen beskrevet tidligere (dvs ,. testing for anriking av nedregulert gener blant probe-sett som gjenkjenner mål på minst en MIR-seedet i settet undersøkt) i en iterativ måte. I den første iterasjon, undersøkte vi den hypergeometriske berikelse fått når de vurderer uttrykk mønstre av målene for bare den første MIR-frø. I den andre iterasjon, undersøkte vi den hypergeometriske anrikning oppnås når man vurderer de uttrykk mønstre av målene for de første og andre MIR-frø, og så videre. Bemerkelsesverdig, ble den beste poengsummen oppnådd når de vurderer målene for de første 74 Mir-frø, som bekrefter at, ja, nesten alle av de opprinnelige 77 biologisk aktive miRNA arter bidrar til den observerte uttrykk downregulation. For å sikre at disse resultatene var ikke på grunn av bestemte funksjoner i de analyserte data, undersøkte vi andre brystkreft datasett, for eksempel E-MEXP-882 [35], og behandlet dem med ulike normaliserings ordninger (GC-RMA, MAS5.0) . Ved hjelp av den hypergeometriske testen, fant vi en tilsvarende betydelig nedregulering av miRNA målgener (81 biologisk aktive MIR-frø, p 10
-134 hypergeometriske berikelse test), fremme styrke hypotesen om at den globale nedregulering av miRNA målrettede gener observert i brystkreft er ikke spesifikke for en bestemt studie.
en mulig årsak til den observerte nedregulering av mikroRNA målgener kan være virkningen av transkripsjonsfaktorer (TFS) som co-regulere disse genene [36]. Søker etter kjente TF bindingsseter i promotorområdene i mål transkripsjoner av hver av de 77 MIR-frø, fant vi en betydelig berikelse (
p
0,05) for 82 TFS (metoder). Bindingssteder for disse TF’er ble funnet i 30% av probe-sett som er tilstede i matrisen. Etter eksklusjon av alle utskrifter med mulige bindingssteder for de TFS, likevel observerte vi en meget betydelig p-verdi for anriking av downregulated gener blant miRNA mål (p 10
-96).
Deretter setter vi å liste de genene som har spådd målwebområder for de 77 Mir-frø, og er derfor forventes å bli påvirket av den økte miRNA aktivitet (tabell S5). Vi funksjonelt preget dem ved hjelp av genet ontologi (GO) merknader, og så for statistisk anrikning av spesifikke kommentarer (Tabell S6). Denne analysen viser at flere biologiske prosesser var overrepresentert blant genet målene for disse mirnas: regulering av transkripsjon, utvikling og differensiering, ubiquitin syklus, signaltransduksjon, transport, og svulst undertrykkelse (synonym kategori: regulering av progresjon gjennom cellesyklus) (FDR
p
10
-9). Som vi tidligere så har de fleste av disse genene viste redusert ekspresjon verdier i tumorer, men ikke alle. Vi så for funksjonell kommentarer som kunne karakteriserer probe-sett som ble nedregulert i svulster, sammenlignet med de andre spådd mål som ikke var effektivt nedregulert. Vi fant ut at cellesyklus arrest var den mest betydelig beriket annotering (FDR
p
2 · 10
-2), noe som tyder på at miRNA-regulerte gener som forårsaker cellesyklus arrest er faktisk nedregulert i svulster.
Siden effektiviteten av genet Slå av microRNAs øker med antall målse, så vi for gener som frakter flest mål nettsteder for våre 77 Mir-frø. Dette svarer til toppen av tabell S5. I samsvar med de beste identifisert GO merknader, finner vi gener som regulerer gentranskripsjon:
CPEB4 plakater (cytoplasma polyadenylation element binding 4), som koder for et protein antas å styre polyadenylering-indusert oversettelse i tidlig utvikling, har det høyeste antallet av målet nettsteder (38), og er nedregulert. To andre medlemmer av CPEB familien,
CPEB2 Hotell og
CPEB3
, også vises høyt på listen med 26 og 25 mål områder, henholdsvis, og er også downregulated;
DDX3X plakater (DEAD boks polypeptid 3, X-bundet), en RNA helicase, har 33 målse, og tilhørende probe-sett rapporterer også nedregulering (p = 0,002, 0,00001);