PLoS ONE: En High Resolution Genome-Wide Scan av HNF4α Recognition nettsteder konkluderer en Regulatory Gene Network i Colon Cancer

Abstract

lever nukleær faktor HNF4α er en allsidig transkripsjonsfaktor og kontroller uttrykk for mange gener i utvikling , metabolisme og sykdom. For å avgrense sitt regulatoriske genet nettverk i tykktarmskreft, og for å definere nye genet mål et omfattende genom-wide skanningen ble utført med en oppløsning på 35 bp med kromatin IP DNA hentet fra menneskets tykktarm kreft cellelinje Caco-2 som er en spesielt rik kilde HNF4α. Mer enn 90% av HNF4α bindingsseter ble kartlagt som promoter distale sekvenser mens forsterkerelementer kan defineres til å fremme kromatin løkker for interaksjon med andre promoter-bundet transkripsjonsfaktorer. Sequence motiv analyse av ulike genetiske algoritmer dokumentert en unik enhanceosome som besto av kjerneproteiner ERα, AP1, Gata og HNF1α som samarbeider transkripsjonsfaktorer. Samlet 17.500 DNA-bindingsseter ble identifisert med et gen /bindingssete forhold som avvek seks ganger mellom kromosomer og gruppert i forskjellige kromosom regioner blant 6600 gener målrettet av HNF4α. Bevis er presentert for kjernefysisk reseptor krysstale av HNF4α og østrogen reseptor α som er rekapitulert på sekvensen nivå. Bemerkelsesverdig, er Y-kromosomet blottet for HNF4α bindingssteder. Den funksjonelle betydningen av berikelse områder ble bekreftet i genom-wide genuttrykkstudier med varierende HNF4α protein nivåer. Tatt kollektivt, er et genom-wide skanning av HNF4α bindingssteder rapportert til bedre å forstå grunnleggende mekanismer for transkripsjonen kontroll av HNF4α målrettede gener. Novel promoter distal bindingssteder er identifisert som danner en enhanceosome dermed tilrettelegge RNA prosessering hendelser

Citation. Weltmeier F, Borlak J (2011) High Resolution Genome-Wide Scan av HNF4α Recognition nettsteder konkluderer en Regulatory Gene Network i Tykktarmskreft. PLoS ONE 6 (7): e21667. doi: 10,1371 /journal.pone.0021667

Redaktør: Ying Xu, University of Georgia, USA

mottatt: 02.02.2011; Godkjent: 06.06.2011; Publisert: 28.07.2011

Copyright: © 2011 Weltmeier, Borlak. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble finansiert av Niedersachsen Kulturdepartementet og biovitenskap og Volkswagen fundament, Tyskland. Grant Nummer: 25A.5-7251-99-3 /00. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

lever~~POS=TRUNC nukleær faktor HNF4α er medlem av den nukleære reseptor super og en svært allsidig transkripsjonsfaktoren [1]. Dette sink finger-proteinet blir uttrykt i lever, tarm, bukspyttkjertel og andre vev, og binder seg til beslektede DNA-sekvenser som en homodimer [2]. I det siste, var noen dusin promoter bindingssteder rapportert. Bruken av kromatin immunpresipitering og microarray hybridisering ChIP-chip metoder viste at disse er bare den minste brøkdel av de faktiske HNF4α bindingssteder. Ved anvendelse av fliser matrise som omfatter koder for regionene som utgjør 1% av genomet i den humane hepatom-cellelinje HepG2 [3] totalt 194 HNF4α bindingssetene kunne kartlegges. I en annen studie HNF4α bindingsseter i hepatocytter og bukspyttkjertelen holmer ble kartlagt, men tilnærmingen fokuserte på Promoterregionene bare [4]. Per i dag har et genom-wide fotavtrykk av HNF4α ikke blitt rapportert. Spesielt er HNF4α en master regulatorisk protein og dysfunksjon av HNF4α har vært assosiert med metabolske og kreftsykdommer. Vi var spesielt interessert i å utforske en HNF4α genomisk fotavtrykk i menneskets tykktarm adenocarcinmoa Caco-2 cellelinje som har vært mye brukt til å utforske HNF4α aktivitet [5] og dermed identifisere et nettverk av regulerte gener. Nærmere bestemt, skiller cellelinjen inn i enterocyttene ved samløpet [6] og uttrykker HNF4α proteiner kan sammenlignes med lever [7]. Her rapporterer vi den første genom-wide scan som muliggjorde en identifisering av 17.500 bindingssteder målrettet av HNF4α og beskrive deres kromosomfordeling. I tillegg studerte vi konsekvensene av HNF4α protein induksjon på transkripsjonen aktivitet av

de novo

identifiserte gener, og viser god overensstemmelse mellom roman gen mål og deres ekspresjon i Caco-2 celler. Til slutt, analyserte vi HNF4α bindingssteder for beriket bindende motiver og identifiserte samarbeidtranskripsjonsfaktorer som syntes å opptre på konsert med HNF4α i en enhanceosome av transkripsjonsregulering.

Resultater

Chromatin IP eksperimenter ble utført med Caco-2 cellekulturer og et antistoff svært spesifikk for HNF4α. Spesielt, ble samlet inn, så vel som IP-DNA fra tre uavhengige biologiske replikater oppnådd og underkastet en optimal protokoll for objektiv forsterkning i henhold til den produserer anbefaling (se også Materialer og metode, avsnitt). Den forsterkede DNA fra uavhengige eksperimenter ble hybridisert til Affymetrix menneske flislegging 2.0R arrays med et genom-wide oppløsning på 35 bp. Deretter ble rådata kontrollert for anriket regioner ved anvendelse av tre uavhengige algoritmer (TAS [8], MAT [9] og Tilemap [10]). Innledende cutoff kriterier ble satt på svakt beriket positiv kontroll (

OTC

) og ytterligere forbedret basert på frekvensen av HNF4α -motifs innenfor beriket regionene, som bestemmes av MATCH algoritmen [11]. For å få tillit i dataene, ble resultatene fra de tre algoritmer krysses. Overlappingen av berikelse nettsteder (ES) identifisert av de tre tilnærmingene var svært høy (Fig. 1), selv om små forskjeller ble observert muligens på grunn av de ulike gjenta biblioteker som brukes. Totalt denne tilnærmingen førte til en identifisering av 17,561 ES (Tabell S1). Videre ble en lav stringens datasett generert ved å flette ES data oppdages med MAT og Tilemap algoritmer. Dette resulterte i totalt 25,419 ES (Tabell S2).

Rådata ble analysert med tre ulike programmer (Tilemap, MAT og TAS) for å identifisere HNF4α bindingssteder. Selv om ulike parameterinnstillinger (f.eks båndbredde på 200, 300 og 400 nukleotider), og forskjellige algoritmer ble anvendt, overlappingen var overraskende høy. Venn-diagrammet ble beregnet ved hjelp av kryss funksjon av Galaxy [47].

I tillegg ble 15 ES kjente HNF4α genet mål valgt og deres berikelse i den primære IP-DNA ble bestemt av realtime kvantitativ PCR . For alle valgte områder kan berikelse bekreftes. Således robustheten og kvaliteten på dataene ble validert (fig. 2). Blant de identifiserte ES var det HNF4α bindingssteder som allerede er beskrevet i litteraturen eller rapportert andre steder, for eksempel

AAT plakater (R00114),

GCC plakater (R08885),

PCK plakater (R12074 ),

ApoB plakater (R01612),

CYP2C9 plakater (R15905),

AKR1C4 plakater (R13037),

ACADM plakater (R15923) eller

CYP27A1 product: (R15917). I tilfelle av SHBG (R15941), var ES bestemt innen noen få hundre basepar i forhold til de rapporterte bindingssteder. Andre steder bindende beskrevet i litteraturen, som

ALDH2 plakater (R15845), kan ikke bekreftes. Men kvantifisering av real time PCR viste at

ALDH2

nettstedet ble ikke beriket i den primære IP-DNA. Som HNF4α protein fungerer på en vevsspesifikk måte, er det ikke uventet at enkelte ES ikke er bundet i Caco-2 celler; deres tilgjengelighets heller er avhengig av kromatin organisasjon, som i sin tur er avhengig av celletype. Dette støttes av uavhengige undersøkelser, hvor signifikante forskjeller i DNA-bindingsseter i ulike celletyper hadde blitt observert [12].

Anriking av nye HNF4α bindingssteder oppdaget av Chip-chip ble bekreftet av Real Time PCR. Spon DNA fra tre uavhengige eksperimenter ble anvendt. Normalisering ble utført ved hjelp av en β-aktin negativ kontroll, og verdiene er vist som fold berikelse versus total inngang. HNF1α er oppstrøms en annen negativ kontroll, som ligger oppstrøms av den kjente HNF4α bindingssetet i HNF1α promoter og brukes til å bekrefte ß-aktin negativ kontroll.

Den HNF4α Motivet er høyanriket innen chip regioner

chip-beriket regionene ble undersøkt for HNF4α bindende motiver med MATCH algoritme [11]. Bruke strenge kriterier for å minimalisere falske positiver, . 14-fold berikelse ble observert for HNF4α målrettet sekvenser sammenlignet med genomisk bakgrunn (tabell S3)

De delene av 500 bp omgir 17,561 identifisert bindingsseter ble analysert for HNF4α motiver med innstillinger for å minimalisere falske negativer ved bruk av den MATCH algoritmen [11]. I hovedsak regioner ble delt inn i binger på 25 bp, og antall forekomster av de ulike motivene innenfor hver bin ble telt. Dette resulterte i totalt 23,145 motiver og tilsvarer 1,32 motiver /ChIP regionen. For 98,1% av chip regionene minst ett motiv ble oppdaget. Dette tyder på at de fleste av chip regionene ble beriket på grunn av direkte binding av HNF4α. Av samme tilnærming bindingsstedene rapporterte for Socket regioner [3] ble undersøkt og 1,13 motiver /Chip-regionen ble anslått som er mindre enn observert i denne studien å eventuelt foreslå høye oppløsning flislegging arrays for å bedre identifisere ES. Deretter ble fordelingen av de HNF4α motivene rundt midten av brikken anriket regionene analysert (fig. 3a). Flertallet av motiver er plassert i et område på bare rundt 500 basepar. Når de anrikede regionene til de toppenes posisjoner detektert ved MAT-algoritmen ble justert mot midtstilling, antall HNF4α motiver økes, således som indikerer at topp-posisjon bedre estimater selve bindingssetet. I tillegg ble det Gibbs-motivet sampler anvendt for å identifisere ES regioner for å muliggjøre enkel

de novo

definisjonen av HNF4α motiv (fig. 3b).

a) HNF4α motiver i området av 1000 bp omkringliggende berikelse hotellet (ES) rush eller center posisjoner som oppdages med MATCH, ved hjelp av konsentrasjon for å minimere falske positiver. Avstanden fra sentrum av detekterte motiver til topp eller midtstilling av ES ble beregnet. Et histogram ble opprettet ved hjelp skuffer av 50 nukleotider rundt midten eller toppstillinger. Den blå linjen viser avvik på HNF4α motiver i forhold til ES sentrum viser den røde linjen avviket i forhold til topp-posisjon. b) HNF4α ChIP-chip ES for å gi enkel

de novo

prediksjon av HNF4α bindende motiv. Etter analyse av sekvensen av regionene beriket av HNF4α ChIP-chip med Gibbs motiv sampler ble HNF4α-motiv faktisk oppdaget to ganger, med andre motiv presentere bare en halv side. c) Bevaring av alle HNF4α bindingsseter (blå linje). ES sentre (blå) eller Peak stillinger (rød) ble forlenget til 1000 bp i begge retninger, og for hver nucleotide gjennomsnittlig bevaring poengsum, basert på høy kvalitet PHAST-Cons informasjon fra UCSC GoldenPath Genome Resource, ble beregnet. De gjennomsnittlige bevaring score ble plottet mot nukleotider posisjon. Analyser ble utført med CEAS [43].

For å understreke den biologiske betydningen av de identifiserte bindingssteder deres gjennomsnittlige bevaring ble studert i tillegg. Nukleotidene i sentrum, hvor et bindingssete som kan forventes, viser en to ganger høyere enn de som er bevaring ved endene av tomten (genomisk bakgrunn) (fig. 3c). Igjen, når brikken beriket regionene ble justert ved peak posisjon, bevaring peak var enda bedre definert.

HNF4α binder seg hovedsakelig til forsterkerelementer

Avstanden fra HNF4α bindingssetet til nærmeste transkripsjon startsetet (TSS) av en RefSeq-genet ble bestemt. Her ble det observert en nesten fem-ganger overrepresentasjon av bindingssetene i promoterregionen fra -1000 til 0 i forhold til TSS (fig. 4a, b). Men bare 5,8% av alle bindingssteder kartlagt til promotor proksimale regioner og 3,6% av alle RefSeq arrangører er bundet av HNF4α. En tilsvarende og vesentlig mangel på preferanse for binding til 5 «promotor-proksimale regioner hadde blitt rapportert for transkripsjonsfaktorene Sp1, P53, cMyc og ERα [13], [8]. Mens noen transkripsjonsfaktorer som E2F1 viser en klar preferanse for 5 «promotor-proksimale regioner [14], samler bevis er sterke bevis for promotor-proksimale regioner for å utgjøre bare en liten brøkdel av pattedyrgen regulatoriske sekvenser. Faktisk kan noen av de nukleære reseptorer viser høyere aktivitet ved forsterker i stedet for promoter-bindingsseter [13], [15]. Derfor studier med promoter arrays er av begrenset verdi.

a) Plassering av HNF4α bindingssteder i forhold til nærmeste TSS av RefSeq gener i forhold til tilfeldig fordeling. Områdene med 100.000 nukleotider som omgir hver TSS ble delt i binger på 5.000 nukleotider, og antallet bindingsseter i hver beholder ble tellet. b) Genomisk fordeling av HNF4α bindingssteder. Antallet bindingssteder som ligger i de angitte områder av RefSeq kommenterte gener ble beregnet av programvareverktøy CisGenome. TSSup1k: 1000 bp oppstrøms for en transkripsjon start hotellet (TSS); TESdown1k: 1000 bp nedstrøms en transkripsjon slutten nettsted. c) Fordeling av HNF4α bindingssteder ligger proksimale TSS av RefSeq gener, sammenlignet med tilfeldig fordeling. Områdene med 5000 nukleotider som omgir hver TSS ble delt i binger på 200 nukleotider, og antallet bindingsseter i hver beholder ble tellet. d) overrepresentasjon av HNF4α bindingsseter i oppstrøms og nedstrøms TSS proksimale regioner og i første, andre en tredje introner av RefSeq kommenterte gener, i forhold til en tilfeldig kontroll regioner. Posisjonene av TSS, første, andre og tredje introner av RefSeq merkede gener ble hentet fra UCSC, og antallet HNF4α bindingssteder som ligger i de spesifiserte områder ble beregnet. TSSup600: 600 bp oppstrøms for en transkripsjon start stedet; TSSdown600: 600 bp nedstrøms en transkripsjon start stedet; TSSup10k: 10000 bp oppstrøms for en TSS; TSSdown10k. 10000 bp nedstrøms for en TSS

En analyse av fordelingen av ES 600 bp rundt TSS gitt bevis for fortrinnsrett binding i oppstrømsområdet (Fig 4c og d.). Imidlertid, i en avstand som er større enn 800 bp av TSS, blir mer bindingsseter lokalisert nedstrøms. Spesielt er mange transkripsjonsfaktorer bindingssetene som ligger i den første intron; den andre topp er vist på fig. 4c er på grunn av binding av intronic regioner. Hyppigheten av HNF4α bindingsseter i RefSeq kommenterte gener ble videre analysert. Dette gjenspeiles en overrepresentasjon av ES i de første introner, men i mindre grad i andre eller tredje (Fig. 4d).

Viktigere en fersk HNF4α ChIP-chip studien antydet promoter-proksimale ES skyldes indirekte veksel av HNF4α med andre transkripsjonsfaktorer [3]. Følgelig ble en modell utviklet der HNF4α bindes til fjerne forsterkerelementer og skaper kromatin løkker ved å samhandle med andre promoter-bundet transkripsjonsfaktorer. Dessverre er denne modellen var basert på mindre enn 1% av genomiske sekvenser. Basert på genomet bred skanne rapportert heri HNF4α bindingsmotiv i promotor-distale regionene er overrepresentert i forhold til promotor-proksimale regioner (fig. 5a), desto mindre regioner med lav anrikning vise en høyere prosentandel av promotor-proksimale bindingssteder enn regioner med høy anrikning (fig. 5b). Muligens, HNF4α kontakter promoter-proksimale områder av fysisk interaksjon med andre transkripsjonsfaktorer og derfor viser arrangøren samt en forsterker bindingsaktivitet.

a) Bootstrapping analyse av HNF4α bindende motiv (matrise M01031) i promoter-proksimale og arrangøren distale regioner. 100 promotor-proksimale ES (-138 til -2 forhold til TSS) ble sammenlignet med 100 promotor-distal ES (-24972 til -23489 forhold til TSS) av bootstrapping analyseverktøyet Pobo [48]. Arrangøren-proksimale ES viser et betydelig lavere antall HNF4α motiver. b) ES (300 bp omgir topp-posisjon) er sortert etter deres P-verdi (som beregnet av MAT algoritme) og delt inn i hyller av 1000 ES. For hver binge antall HNF4α motiv forekomster og prosentandelen av promotor-proksimale ES ble beregnet. Som det kan ses, ES med en høy p-verdi (svak ES) har større sannsynlighet for å bli plassert promoter-proksimalt, men ikke inneholder noe HNF4α bindende motiv.

Fordelingen av identifiserte ES tvers av kromosomene variert 6 fold. Påfallende er Y-kromosomet blottet for HNF4α ES (tabell S6) og kromosom distribusjon av ES er ikke tilfeldig fordelt; snarere klynger er dannet (figur 6a;. Fig. 7). Disse klyngene er ikke relatert til forskjeller i genet tettheten i disse områdene, som vist for kromosom 10. Regionen med høyest tetthet av bindingssteder på kromosom 10 inneholder to klynger av bindingsseter med overlapp loci ACSL5 og VTI1A1 (Fig. 6b ). Ved å skanne genomisk sekvens for vinduer 100.000 bp som inneholder ≥ 10 HNF4α bindingsseter, kunne femten klynger defineres (tabell S7). Faktisk har de fleste forsterkere synes å være promiskuøse og således regulere multiple gener [16]. Mens Enhancer aktivitet kan foregå over flere hundre kilobaser [17] og til og med tilfeller av inter-kromosom regulering av forsterkere har blitt rapportert [18], de fleste er innen 100000 bp av deres respektive TSS. For bedre å definere en mulig enhanceosome for målgener sekvenser nærmest RefSeq gener med en TSS atskilt med mindre enn 100.000 nukleotider ble valgt (tabell S8).

a) Fordelingen av HNF4α bindingsseter (lilla linje diagram, øvre halvparten) er sammenlignet med fordelingen av kjente gener på kromosom 10. Grønne piler markerer to gen-sparsom regioner hvori ES er funnet. De røde pilene markerer to regioner med et høyt antall HNF4α bindingsseter og et lavt antall av gener. Analysene ble utført ved hjelp av Ensembl verktøy Karyoview (https://www.ensembl.org/Homo_sapiens/karyoview). b) Klynger av HNF4α bindingssteder i en genomisk region på kromosom 10 med høyt innhold av bindingssteder (regionen preget av den andre røde pilen i a)). Bindingsstedene identifisert i denne studien, som vises som blå topper i øvre halvdel, blir presentert ved hjelp av IGB genomet leseren. Bindingsstedene er fordelt i to klynger rundt transkripsjon start stedet av ACSL5 locus og i 3′-regionen i VTI1A locus.

Hvert kromosom ble delt inn i 150 «

binger

«, og innenfor hver bin antall ES ble regnet. I den blå linjen diagrammet, er antall HNF4α bindingssteder innenfor hver bin representert som en enkelt datapunkt. Under hvert kromosom den minimale og maksimale antall bindingssteder som befinner seg i en enkelt kasse er gitt. Analysene ble utført ved hjelp av Ensembl verktøy Karyoview (https://www.ensembl.org/Homo_sapiens/karyoview).

HNF4α transkripsjonsfaktor krysstale

For å søke etter transkripsjonsfaktor cross-talk brikken regionene for overrepresentert motiver ble vurdert. Blant motivene med høyest berikelse er matriser som ligner på HNF4α bindende motiv, f.eks de for COUP-TF, PPAR eller LEF1 (fig. 8, Bord S3, S4, S5). Disse transkripsjonsfaktorer er kjent for å konkurrere med HNF4α for vanlige bindingsseter [19] – [21]. Men mange motiver ulik HNF4α, f.eks bindende motiver for HNF1α, AP1 eller Gata transkripsjonsfaktorer, ble også betydelig beriket. Dersom disse faktorene virker i likhet med HNF4α, kan det forventes at hyppigheten av motivene øker med avtagende avstand til HNF4α bindingssteder. Derfor ble hyppigheten av slike motiver i forhold til de HNF4α bindingssetene analysert (fig. 9a og 9b). Anrikning av disse motivene er begrenset til et område på noen få hundre basepar rundt topp-posisjon, og derfor støtter ideen om at de er en del av et enhanceosome definert av HNF4α. I tillegg til en økning i hyppigheten av bindende motiver for AP1, GATA, ERα og HNF1α ble observert en invers sammenheng mellom HNF4α og CART motiver, men det var ingen sammenheng med SREBP1 (Fig. 9a). Det er fristende å spekulere i at dette er av regulerende betydning for HNF4α. Andre analysert motivene viste bare en svak sammenheng mellom antall motiver og avstanden til topp posisjon, selv om de var tydelig beriket i Chip regioner (f.eks USF, CREB, HNF6).

10000 viktigste ChIP- beriket regioner ble analysert med hensyn på overrepresentasjon av motivene ved bruk av CEAS verktøyet [43]. Vist er de 10 motivene med den mest betydningsfulle berikelse, mens overflødige motiver (dvs. flere motiver for samme transkripsjonsfaktor) ble fjernet. Likheten eller ulikhet av motivene er visualisert ved hjelp Weblogo avbildning (https://weblogo.berkeley.edu/). Motif berikelse analyse med Genomatix RegionMiner og MATCH [11] finnes i tabell S3, S4, S5.

a) Peak stillinger (representert som 0) ble utvidet til 500 bp i begge retninger, og motiver ble detektert ved bruk av den MATCH algoritmen [11] med cutoff kriterier for å minimalisere summen av falske positive og falske negative. Regioner ble segmentert i binger på 25 bp, og antall forekomster av de ulike motivene innenfor hver bin ble telt. b) Plot av den relative avstand på HNF4α motivene til andre motiver beriket i brikken regionen. Innenfor Chip regioner de konserverte HNF4α motiver der identifisert. Sekvensene av de 500 nukleotider rundt disse mest konserverte HNF4α motivene hvor hentes og analysert for de motiver av andre TF som ble også beriket i brikken regioner. Deretter ble avstanden mellom disse motivene og HNF4α motiv beregnet ved hjelp CisGenome for motiv deteksjon og plottet som histogram ved hjelp av hyller av 20 bp. Den HNF4α motivet er funnet i sentrum, nå fra bp -6 til bp 6. HNF4α og ERα har felles og overlappende bindingssteder. c) Visning av overlapping mellom bindende motiver av HNF4α og østrogen reseptor (ERα) ved bruk av Weblogo illustrasjoner. Begge motivene viser en delvis overlapping. d) Overlapping mellom ERα bindingsseter og HNF4α bindingssteder. Den høye stringens sett av ERα bindingssetene som er identifisert av Chip-chip [13] ble oppnådd. Prosentandelen av ERα bindingssteder identifisert i denne studien, og også bundet av HNF4α vises i et stolpediagram. Overlappingen av ERα bindingssteder med tilfeldige kontrollregioner ble bestemt.

Den høye sekvenslikhet bindingsseter for HNF4α og østrogen reseptor (ERα) er av stor betydning (Fig. 9c). For ytterligere å analysere sannsynligheten for co-belegg av anrikede motiver de HNF4α bindingsseter ble bestemt nøyaktig ved motiv analyse. Den genomisk plasseringen av høyeste scoring HNF4α motiv innen chip regionene ble hentet og utvidet til 500 nukleotider til venstre og høyre flankesekvenser. Innenfor disse sekvensene, ble andre anrikede motiver detektert og avstanden til HNF4α motivet ble beregnet (fig. 9b). Som forventet, mest ERα motivene co-finne på HNF4α ES forårsaker en høy topp i sentrum. I motsetning til dette, HNF1α, AP1 og Gata motivene viser anrikning i en avstand på 20 til 60 nukleotider til HNF4α motiv. Det er også en berikelse for mindre konservert HNF4α bindingssteder i umiddelbar nærhet til den høyeste scoring HNF4α motiv. Dette overrepresentasjon av mindre konserverte HNF4α motivene kan spille en rolle i å øke sannsynligheten for HNF4α binding på den lokale sekvens konteksten rundt bindingssetet.

Som ERα motiv overlapper delvis med HNF4α motiv, det er fristende å spekulere at en slik anrikning innenfor chip regionene er på grunn av en funksjonell sammenheng mellom de to faktorer. Nylig ble et genom-wide kartet ERα bindingssteder rapportert [13]. Derfor er data for ERα og HNF4α områder ble analysert og funnet å betydelig overlapper (fig. 9d). Ved hjelp av enten lav eller høy stringens satt av HNF4α eller ERα bindingsseter opp til ca 15% av ERα bindingssteder ble også angrepet av HNF4α, og dermed støtter ideen om samarbeid mellom HNF4α og ERα atom reseptoren. Viktigere, flere uavhengige undersøkelser rapporterer synergisme i transkripsjonsfaktor-aktivitet av HNF4α og ERα i genregulering av, for eksempel, apolipoprotein A1, apoVLDII og den lille heterodimeren partner.

A genom-wide scan viser HNF4α master-funksjon

data fra denne studien ble sammenlignet med publiserte data for å identifisere områder som overlapper blant disse studiene (fig. 10). Av de 194 ES rapportert innenfor kode regioner [3], 76 overlappet med funnene i denne studien. Dessverre kode regionene utgjør 1% av hele genomet bare. Videre i en promoter-fokusert studie [4] 1,553 bundet sekvensene ble rapportert for hepatocytter. I denne studien og ved å velge sammenlignsekvens regioner totalt 575 bindingsseter kan bli undersøkt. Av disse 200 bindingsseter var vanlig, derfor reconfirming 13% av den foreslåtte promotorbindingsseter. Videre er den samme søkeren rapporterte ES for pankreatiske øyer, men bare 9% kan bli bekreftet i foreliggende undersøkelse med IP-DNA fra den Caco-2-cellelinjen. kan oppstå slike forskjeller fra de ulike eksperimentelle protokoller og forskjeller i celletyper.

Andel HNF4α bindingssteder identifisert av Rada-Iglesias et al. [3] eller Odom et al. [4] som kan bli bekreftet i denne studien. For Rada-Iglesias et al. en kontrollgruppe av tilfeldige genomiske sekvenser ble anvendt for å beregne den tilfeldige overlapper hverandre. For Odom et al., Ble en kontrollgruppe laget ved å velge tilfeldig et antall av promoter-regionene fra Huk13 matrisen brukt i deres studie, lik antallet av de promotorer detektert som å være bundet av HNF4α.

Biologiske ontologier av

de novo

identifisert HNF4α genet mål

Basert på Gene ontologi

de novo

identifisert gener ble gruppert (tabell S9). Mange av de målrettede gener som er involvert i forskjellige metabolske prosesser, f.eks lipid, organisk syre eller karbohydratmetabolisme. Kategorier knyttet til transport, dvs. lipid transport, ble betydelig overrepresentert som var fettsyrer og kolesterol stoffskiftet [1], [22]. I tillegg ble mange gener for utvikling og differensiering identifisert derfor betryggende HNF4α rolle i utvikling [23] og epitelial differensiering [22], [24] – [26]. Dette proteinet styrer også insulin sekretoriske vei [27] og er knyttet til sjeldne monogen lidelse, dvs. modenhet-onset diabetes av unge (MODY) [28]. Dermed gener målrettet av HNF4α i insulin signalveien samt slik relatert til celledød og tumor suppressor aktivitet ble identifisert [29]

Definere funksjonelle bindingssteder -. Sammenheng mellom genom-wide HNF4α chip chip og genuttrykk data

en vanlig tilnærming for å identifisere gener målrettet av en transkripsjonsfaktor er å bestemme mRNA overflod forårsaket av den økte eller avtok transkripsjonen aktivitet som undersøkes i humane embryonale nyre (HEK293 [30]) og hepatomceller (HUH7 [31], HepG2 [32]). Overraskende, HNF4α transfeksjon eksperimenter påvirket transkripsjon av et lite antall bare gener. Mens det er kjent at transkripsjonsregulering ikke er mediert ved nivået for DNA-binding alene [33] i slike eksperimenter fleste transkripsjonsfaktorer bindes under «ikke-aktiverende» betingelser. For å bekrefte funksjonelle bindingssteder av

de novo

identifisert HNF4α genet mål, Caco-2 cellekulturer ble behandlet med en induktor av HNF4α protein [34]. Etter behandling av Caco-2-celler med Aroclor 1254, binding av HNF4α proteinet til

HNF1α

promoteren ble øket [7], mens induksjon av protein ble bekreftet ved Western blotting eksperimenter (fig. 11). De Aroclor 1254 behandlede kulturer ble utsatt for genom-wide transkripsjon profilering. Ved hjelp av strenge kriterier, ble 536 unike RefSeq-merket gener definert som forskjellig uttrykt (tabell S10). Av disse ble 383 gener oppregulert og 153 nedregulert. Promotersekvensene regulerte gener ble analysert for HNF4α bindingsseter og sammenlignet med en liste over nylig identifiserte spon chip genet mål. En overlapping på 63% eller 336 differensielt uttrykte gener (Tabell S11) ble identifisert som HNF4α genet mål, derfor bekrefter den funksjonelle betydningen av ES identifisert i chip-chip-analysen.

a) HNF4α Western blotting av 20 ug Caco-2 celleekstrakt. En klar induksjon av HNF4α protein-ekspresjon ble observert etter 48 timer og 72 timer med Aroclor1254 behandling. b) Elektroforetisk mobilitet skift analyser med 2,5 ug Caco-2 cellekjerneekstrakt og oligonukleotider svarende til A-området av HNF1α promoter (HNF1pro) som 32P-merket probe. I supershift analysene et antistoff rettet mot HNF4α (+) ble tilsatt. Binding av HNF4α ble betydelig økt etter 72 h Aroclor1254 induksjon.

Til slutt, publiserte data på HNF4α overekspresjon pattedyrcellelinjer ble sammenlignet med data fra denne studien. Overlappingen varierte 65-94% av genene som er identifisert (tabell S10). Viktigere var det høyeste overlapping oppnådd i studier som er ansatt knock-down siRNA eksperimenter for å validere sine funn [32]. Derfor kan genet målene rapporteres her betraktes som mer pålitelig.

Diskusjoner

Tidligere forskning på trans-virkende faktorer og deres tilsvarende

cis

-elements fokusert på promoter -proximal bindingssteder. Med utviklingen av ChIP-chip analyser, genom-wide skanner for transkripsjonsfaktorer bindingssteder ble mulig. Dette bedret seg betraktelig en forståelse av grunnleggende mekanismer for transkripsjonskontroll og en identifikasjon av promoter distal bindingssteder tilrettelegge RNA prosessering hendelser.

I denne studien, et genom-wide kartet HNF4α bindingssteder ble bygget. Dette proteinet spiller en avgjørende rolle i leveren utvikling, og dens hoved regulerende rolle i opprettholdelsen av den metabolske kompetansen til leveren har stimulert forskning på HNF4α målrettet kreftterapier for sin evne til å gå tilbake leverkreft til en mindre aggressiv fenotype [35].

denne studien beviser 90% av HNF4α bindingssteder for å bli plassert i promoter-distal regioner og denne fordelingen av ES er lik den som er rapportert for ERα [13]. Spesielt, med unntak av områdene nærmere enn 600 basepar til TSS, bindingssetene var oftere nedstrøms. Derfor ChIP-chip analyser som fokuserer på Promoterregionene bare [4], [36] kan gå glipp av det meste av bindingssteder.

Videre en analyse av HNF4α motiver innenfor chip-beriket regionene viser så høy nøyaktighet som i

Legg att eit svar