PLoS ONE: Avansert Computational Biology Metoder Identifiser Molekylære Brytere for kreftform i en EGF Mouse Model av leverkreft

Abstract

Molekyl årsakene ved hvilken den epidermale vekstfaktor-reseptor-tyrosinkinase induserer malign transformasjon er stort sett ukjent. For bedre å forstå EGFs «transformerende kapasitet hele genomet skanninger ble påført på en transgen musemodell av leverkreft og utsatt for avanserte metoder for matematisk analyse for å konstruere de novo gennettverk basert på en kombinasjon av sekvensanalyse og medrevne grafiske-topologisk algoritmer. Her har vi identifisert transkripsjonsfaktorer, prosesser sentrale noder og molekyler for å koble hittil ukjente samvirkende partnere ved nivået for protein-DNA interaksjon. Mange av dem kunne bekreftes av electro bandet skiftet assay på gjenkjennelses av genet spesifikke arrangører og ved Western blotting av kjerneproteiner. En roman cellulære reguleringskretser kan derfor bli foreslått som kobler cellesyklus regulerte gener med komponenter av EGF signalveien. Promotoren analyse av differensielt uttrykte gener antydet flertallet av regulerte transkripsjonsfaktorer for å vise spesifisiteten til enten pre-tumor eller tumor tilstand. Påfølgende søk på signaltransduksjon sentrale noder oppstrøms for de identifiserte transkripsjonsfaktorer og deres mål foreslås det insulin-lignende vekstfaktor veien for å gjengi de tumorcellene som er uavhengige av EGF-reseptor-aktivitet. Spesielt, ekspresjon av IGF2 i tillegg til mange komponenter av denne reaksjonsveien var sterkt oppregulert i tumorer. Sammen foreslår en bryter i autokrint signalering for å fremme tumorvekst som i utgangspunktet ble utløst av EGF og demonstrere kunnskap gevinst skjema arrangøren analyse kombinert med oppstrøms nøkkel node identifikasjon

Citation. Stegmaier P, Voss N, Meier T , Kel A, Wingender E, Borlak J (2011) Avansert Computational Biology Metoder Identifiser Molekylære Brytere for kreftform i en EGF Mouse Model av leverkreft. PLoS ONE 6 (3): e17738. doi: 10,1371 /journal.pone.0017738

Redaktør: Michael Polymenis, Texas A M University, USA

mottatt: 6 oktober 2010; Godkjent: 09.02.2011; Publisert: 28 mars 2011

Copyright: © 2011 Stegmaier et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Deler av arbeidet ble finansiert av EU-tilskudd «EuroDia» (LSHM-CT-2006-518153) og Net2Drug (LSHB-CT-2007-037590) og ETB gi GlobCell og BMBF prosjekt TcellTalk samt program for Intenational samarbeid med den russiske departementet Sciences og utdanning og departementet for vitenskap og kultur, Niedersachsen, Tyskland; Grant Nummer: 25A.5-76251-99-3 /00 til Juergen Borlak. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet. PS, NV, AK, EW er ansatte i BIOBASE GmbH, Wolfenbuettel, Tyskland. AK er også ansatt i Institute of Systems Biology Ltd., Novosibirsk, Russland

Konkurrerende interesser:. PS, NV, AK, EW og JB er ansatte i BIOBASE GmbH, Wolfenbuettel, Tyskland. AK er også ansatt i Institute of Systems Biology Ltd., Novosibirsk, Russland. Det finnes ingen patenter, produkter under utvikling eller markedsført produkter å erklære. Dette endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer, som beskrevet på nettet i din guide for forfattere.

Innledning

Epidermal vekstfaktor er en viktig mitogen for hepatocytter for sin evne til å modulere proto-onkogen, så vel som leverspesifikt gen-ekspresjon. For bedre å forstå EGF rolle i ondartet transformasjon en transgen musemodell ble utviklet der EGF var rettet til leveren. Spesielt, transgene mus utviklet leverkreft rundt 7-8 måneder og en svulst scenen avhengig nettverk av EGF-regulerte gener ble identifisert, som tidligere rapportert [1]. Oppmuntret av disse funnene gener knyttet til tumorigenes og progresjon av sykdommen kan bli foreslått. Her ønsket vi å analysere genuttrykk profiler av pre-tumorous og svært differensiert levercellekarsinom med en ny beregningsmåte som muliggjorde identifisering av regulatorer av EGF signalkaskade assosiert med malign transformasjon. En ny metode ble utviklet basert på promotorsekvensanalyse av differensielt uttrykte gener. Spesielt blir transkripsjon av et gen bestemmes til en vesentlig del av aktiviteten av transkripsjonsfaktorer, som i sin tur gjenkjenner bestemte korte DNA-segmenter, dvs. transkripsjonsfaktorbindingsseter (TFBSs) som ofte ligger i promoter-regionen oppstrøms for transkripsjonsstartsetet (TSS). Genekspresjonsprofiler kan således anvendes for å identifisere TFS som potensielt påvirker ekspresjonen av gener under visse cellulære betingelser ved anvendelse av forskjellige genetiske algoritmer og matriser som gjenkjenner TFBSs. Kompleksiteten i genuttrykk dataene kan så bli redusert med identifisering av felles TFS av co-regulert gener. Den her beskrevet og nyutviklede metoden fokuserer på identifisering av transkripsjonsfaktor bindingsseter med co-belegg i arrangører av differensielt uttrykte gener i en statistisk signifikant måte. Dette gjorde hypoteser generasjon og en identifikasjon av transkripsjonsfaktorer som virker på en slik arrangøren satt med det endelige mål å identifisere «molekylære triggere» i gennettverk tvinge hepatocytter inn malign transformasjon. Basert på en slik analyse transkripsjonsfaktorer ble identifisert som kandidat effektorer av ondartet transformasjon som kan fungere i overgangen fra EGF i løpet av uttrykket til ondartet tilstand. For å eksperimentelt validere de beregningsmessige anslag Western blotting eksperimenter av nukleære proteiner og EMSA bånd skift analyser ble utført for å bestemme DNA-bindingsaktiviteten av flere transkripsjonsfaktorer. Rekonstruksjon av signalkaskader oppstrøms av disse TFS tillatt oss å foreslå nedstrøms målene for EGF signalisering i disse to typer cellulære tilstander, dvs. transgenicity og leverkreft. Som et resultat foreslår regulatoriske nettverk som bidrar til en bedre forståelse av EGF-indusert maligniteter. I et forsøk på å søke etter viktige molekyler i signaleringsnett oppstrøms for den identifiserte transkripsjonsfaktorer den insulin-lignende vekstfaktor pathway ble identifisert som faktisk kan representere en molekyl bryter fra EGF-reseptor-tyrosinkinase rute til tumoren tilstand for derved å gjøre malignantly transformerte cellene uavhengig av EGF-reseptor-aktivitet. Ytterligere bevis for denne hypotesen ble oppnådd når genuttrykk av IGF2 og dets ned stream partnere ble undersøkt og funnet å være svært vesentlig indusert i tumorceller som var mange komponenter av denne veien.

Totalt denne studien tar sikte på en bedre forståelse av EGF transformerende kapasitet og kombinerer forskjellige linjer av bevis for en mulig mekanisme for sykdom

Resultatene

Differensial-ekspresjon i transgene (pre-tumor) og tumorvev. sub klassifisering av kjent leveren kreft biomarkører av genuttrykk profiler

forklare 2.3 kartlagt Affymetrix probe sett til 10,262 mus gener. Differensial uttrykk analyse med Ebarrays oppdaget 303 og 355 opp regulerte gener samt 95 og 141 ned regulerte gener i transgene og kreftceller, henholdsvis. Tabell 1 oppsummerer informasjon om innhentet genet lister og Figur 1 viser fordelingen av kjente transkripsjon faktor bindende nettstedet steder i henhold til TRANSFAC database utgivelsen 12,1 (se Materiale og metode, beregning av P-verdier for MATCH score, for ytterligere detaljer). Tabell S1 gir alle MGI genet symboler, TRANSPATH molekyl navn, hvis tilgjengelig, og høyest eller lavest fold endringer målt for probe sett opp regulert eller ned regulerte gener, henholdsvis. En mindre manuell endring ble introdusert til genet satt 5 (tabell 1), hvor en sonde sett kartlagt fire nært beslektede paraloger Bcl2a1a-d. Vi brukte MAFFT justering programvare [2] og Jalview [3] for å inspisere flere justeringer av Bcl2a1 arrangører (Figur S1). Siden promoter sekvenser av disse genene er svært like, analyser en skjevhet i promoter utført i dette arbeidet kan forventes, og vi fjernet derfor tre Bcl2a gener (b-d) fra genet satt 5.

Den røde linjen angir toppen av fordelingen på -115bp forhold til TSS.

Transgene og krefttilstander delt 144 opp regulerte gener og 25 ned regulerte gener (sett 3 og 8, Tabell 1). I etterfølgende analyser vi også betraktes som en potensielt større overlapping, når en probe sett var statistisk signifikant i en kontrast og oppnådde en høy gangers endring i den andre (sett 2, 4, 7 og 9). Således, for 77 av de 303 opp regulerte gener i transgene celler (sett 2), en sonde sett påvist ved statistisk analyse hadde også en fold endring 2 i tumorceller, og disse 77 gener ble tilsatt til 355 genene opp regulert i tumor for å oppnå et utvidet sett med opp regulerte gener i tumorceller. Tilsvarende, 103 av de 355 genene oppregulert i tumor ble tilføyd til den transgene settet for å utlede et utvidet sett med opp regulerte gener i transgene celler (innstilt 4). Likeledes ble genet sett av nedregule respons forstørret på en fold endring under 0,5. Gjenværende undergrupper (sett 1, 5, 6 og 10) ble vurdert særskilt regulert i respektive progresjon tilstand.

I henhold til sykdommen modul av BIOBASE Knowledge bibliotek (BKL) [4], EGF-indusert karsinogenese forårsaket differensial uttrykk av 39 kjente biomarkør gener assosiert med leverkreft /svulster (Tabell S1). Som vist i figur 2, er disse biomarkører som er utvalgt ulike mønstre for ekspresjon tyder på en ytterligere underklassifisering med hensyn til deres respons på pre-tumor og tumor tilstand. Tre gener, nemlig Myc, Glul, Oat, ble midlertidig opp- eller nedregulert i løpet av sykdomsutbruddet, og kan dermed tjene som tidlige markører for leverkreft, som diskriminerer svulsten tilstand (figur 2A). Statistisk analyse også foreslått Dnmt3a, Itga6, og Shc1 imidlertid høye brette endringer ble målt for disse gener i tumorceller som beskrevet ovenfor. Uttrykk av 14 biomarkør gener endret påviselig i begge progresjon stater (figur 2B) som indikerer et ekstra sett av mulige tidlig leverkreft markører. Endelig Ccnd1, Gpc3, Mvk, Pparg, Rbl2, og Robo1 viste en svulst spesifikk respons (figur 2C), hvor ble det observert negative uttrykk endringer for Pparg, som dukket ned regulert i transgene celler (endring 0,4) og betydelig opp regulert i svulster. Samlet utgjør disse resultatene tyder på en raffinert tolkning av kjente biomarkører for leverkreft /svulster. Blant respektive gener kan vi identifisere flere informative signaturer som indikerer spesifikke pre-tumor og tumor markører og viser at uttrykk endringer av noen kjente biomarkører kan faktisk fungere som tidlige indikatorer på sykdomsutbruddet.

Tomtene viser log-Fold endringer i kjente biomarkører som ble differensielt uttrykt i transgene celler (A), begge tilstander (B), eller tumorer (C). Brett endringer av noen gener angitt differensial uttrykk i begge stater, selv om statistisk analyse tildelt dem til en stat bare (stiplede linjer). Flere kjente biomarkører viste progresjon statsspesifikke tiltak, som kan subserve avledning av pre-tumor og tumor signaturer (dristige linjer).

Regulering av cellesyklus og lipid metabolisme endringer gradvis i EGF-indusert hepatocarcinogenesis

Med definert sett med forskjellig uttrykt (DE) gener for hånden, vi dro ut for å identifisere funksjonelle endringer som følger EGF-indusert hepatocarcinogenesis. For dette formål beregnet vi berikelse P-verdier for alle GO biologisk prosess kategorier som er knyttet til i det minste ett gen i transgene eller tumor gensettene og anvendt dem som et mål på relative betydningen av et bestemt biologisk funksjon for et gitt gen sett. For å begrense effekten av falske negative funn i løpet av differensial uttrykk analyse, ble berikelse P-verdier beregnet for lengre gensettene sammensatt av settene 1-4 (opp regulert i transgene celler), 2-5 (opp regulert i tumorceller), 6- 9 (nedregulert i transgene celler), og 7-10 (nedregulert i tumorceller) (tabell 1). Resultater av P-verdien sammenligning er vist i figur 3. I det følgende vil vi fokusere på 15 GO gruppene med største forskjellene mellom log-P-verdier som ble oppnådd i analyser av enten oppregulert eller nedregulert gen sett. Plott av transgene versus tumor P-verdier (Figur 3, A og C) illustrerer at prosedyren beordret kategorier med hensyn til avstand til diagonal (rød linje). Punkter på diagonalen viser ingen forskjell mellom P-verdier. I de utvalgte 15 beste biologiske prosesser, P-verdiene varierte med ca 2-6 størrelsesordener mellom transgene og krefttilstander. I henhold til denne analysen, oppregulering av gener under tumorigenes sterkest endret cellesyklus funksjoner (figur 3B). Merk at legender av figurene 3B og 3D beholde rekkefølgen av log-P-verdi forskjell. Alle de fem GO kategorier, «celledeling», «cellesyklus», «M fase», «mitose», og «M fasen av mitotiske cellesyklus» henspille til endringer i cellesyklus og ble mer betydelig anriket i svulsten gen set, mens oppregulering i transgene celler, ble sterkere rettet mot mekanismer for cellemotilitet samt cellulære komponent organisasjon og biogenese. Foruten endringer av cellesyklus, påpeker funksjonell sammenligning ut endringer i reguleringen av gener som deltar i utviklingsprosesser, cellevekst og anatomisk struktur utvikling (figur 3B), som innebærer potensielle dedifferentiation hendelser. Analyse av downregulation svarene viser at regulering av lipid metabolisme ble sterkt endret i løpet tumorigenesis. De neste to høyest rangerte funksjoner gjelder protein deubiquitination og gallesyresyntese (figur 3D). Tabell S2 gir flere detaljer om gener som sams noen utvalgte biologiske prosessgrupper og deres P-verdier i begge progresjon tilstand. Cellecyklus kategorier høyt rangert ved sammenligning av oppregulert gensettene signifikant påvirket i begge transgene og tumorceller, noe som viser at disse funksjonene gjennomgå progressive forandringer. Spesielt ble gener assosiert med anatomisk struktur utvikling sterkt anriket på transgene og tumor sett (gul prikk og linje, figur 3 A og B). Spesielt, forskjeller viser seg ikke bare i oppregulering av flere gener i tumorcellen; f.eks cellesyklus gruppen av transgene celler omfatter Foxc1, Gadd45a, Hic1, Hus1, Myc, og Uhmk1, som ikke ble påvist i tumor (til tross for forlengelse av genet listen). Det ble ikke observert de mest dramatiske endringer i reguleringen av lipid metabolske gener. Transgene og svulst gensettene involvert i denne funksjonen skilte med 21 gener og berikelse P-verdiene økte med om lag seks størrelsesordener. Videre er protein deubiquitination og gallesyre metabolisme oppviser en bryterlignende regulering, hvor differensial ekspresjon først ble oppdaget i tumoren

(A og B – analyse av oppregulert gener, C og D – analyse av downregulated gener). . A og C) Hver prikk representerer en GO kategori i løpet av to P-verdier. B og D) Topp 15 GO vilkår med størst log-P-verdi forskjell mellom transgene og tumor. Dots tilsvarer kategoriene oppført i B og D er uthevet i A og C, henholdsvis.

Cell-syklus feilregulering ble tidligere identifisert som en årsaksmekanisme av gentoksisk kreftfremkallende [5]. Det er også kjent at leverkreft innebærer lipid metabolske derangements inkludert kolesterol stoffskiftet [6]. Resultatene presentert her viser at sykdomsutbruddet ble fulgt av progressive forandringer i respektive funksjoner. Den ubiquitin-proteasome veien er et relativt nytt mål for kreftbehandling [7]. Ifølge våre genekspresjon data, hepatocarcinogenesis forårsaket nedregulering av tre deubiquitination gener, Dub1, Dub2, og Dub2a, spesielt i svulsten tilstand (tabell S1). Nylig har en deubiquitinating enzym, BAP1, med en rolle i cellesyklusregulering ble beskrevet som tumor-suppressor [8], som støtter relevansen av å finne det tilsvarende GO kategori blant de 15 endrede funksjoner til tross for en moderat anrikning P-verdi i tumoren gen satt (P 0,0001). Nedregulering av deubiquitination gener er i samsvar med tidligere funn, som Ventii og medforfattere også observert mangel på deubiquitinating aktivitet i kreft-assosiert mutanter. Oppsummert ble progressive endringer i regulering av cellesyklusen, utviklingsmessige og lipid metabolske funksjoner chaperoned EGF-indusert hepatocarcinogenesis, mens potensialet bryter lignende regulering observert for små grupper av gener som er definert ved protein deubiquitination og gallesyre-biosyntese, en komponent av leverkolesterolmetabolisme . Disse biologiske funksjoner kan havnen nye biomarkører for sykdomsutbruddet og tumorigenesis.

Klynger av oppregulert signaltransduksjon molekyler i transgene og kreftceller integrere vekstfaktor, cellesyklus, chemokin og cytokin signaler

Nettverk av samspill proteiner utøve en stor del av cellulære funksjoner. Analyse av forskjellig uttrykt molekyler i sammenheng med kjente signalveier muliggjør identifisering av molekylære nettverk målrettet av observerte uttrykk endringer. Vi søkte nettverk cluster-analyse for å foreslå funksjonell sammenheng for signale komponenter kodet av forskjellig uttrykt gener av transgene og tumorceller sammen med støtte nettverkstopologier konstruert fra eksperimentelt påvist signal reaksjoner. Networks ble konstruert for utvidet oppregulering og nedregulering gensettene beskrevet ovenfor. Som et resultat, oppnås vi en klynge hver for oppregulert gener av transgene celler og for oppregulert gener i tumorceller. Et lite nettverk av downregulated gener ble funnet i tumorceller, hvori EGF og beta-c samhandle med SHC og et kompleks bestående av EGF, ErbB1, SHC-1, GRB2, og Sos (ikke vist). De to nettverk av oppregulert gener ble konstituert av 85 og 88 komponenter, inkludert 39 og 41 molekyler oppregulert i transgene eller tumorceller, henholdsvis. Diagrammer av transgene og tumornettverks klynger er vist i figurene 4 og 5. Ytterligere informasjon om differensielt uttrykte gener som koder for molekyler og er gitt i Tabell S3

Red noder: bare i transgene nettverk;. Lys rød: fold endringen var minst to høyere enn i tumor; Lys grønn: fold endringen var minst – to lavere enn i svulsten, Blå: oppregulert molekyl med lignende ganger endring i transgene og tumor. Vær så snill, se tekst for nærmere beskrivelse

Røde noder: bare i tumor nettverk;. Lys rød: fold endringen var minst 2 poeng høyere enn i transgene celler; Lys grønn: fold endringen var minst 2 poeng lavere enn i transgene celler, Blå: oppregulert molekyl med lignende ganger endring i transgene og tumor. Vær så snill, se tekst for nærmere beskrivelse.

Begge nettverkene har en miks av funksjonelle kategorier som vekstfaktor signalering, f.eks gjennom ErbB reseptorer, InsR eller FGFR-en, cellesyklusregulerende kaskader, f.eks involverer cyklin B1, Cdk1, Aurora-A, eller p53, samt cytokin og chemokin-signalisering gjennom IL-1RI og CXCR4. Den kombinerte listen over oppregulert komponenter består av 48 proteiner, hvorav 7 er spesifikke for den transgene nettverk og 9 er bare en del av tumoren nettverk (tabell S3). For 19 av de 32 felles molekylene en kvantitativ forandring i ekspresjon i løpet av tumorigenese kan hypotese som indikert ved farging node på nettverket diagrammer (grønt og rødt lys nodene, figur 4 og 5). Spesielt gjelder dette en kompakt modul av cellesyklus regulatorer, nemlig Survivin, cyclin B1, Cdk1, Plk1, og Bub1, som uttrykk økt ca 2 ganger i tumor mot transgene celler i henhold til målt fold endringer. Dessuten foreslår en annen nettverksanalyse, tumor-spesifikk modul av cellesyklus regulatorer dannet av p107, p130, p15INK4b, og Wee1 (figur 5). Disse resultatene støtter videre hypotesen om at EGF-indusert karsinogenese drives delvis av progressive endringer av cellesyklusregulering, som, som nettverkene viser, kan også manifest gjennom kvantitative endringer i uttrykk.

De presenterte nettverks klynger avsløre potensielle virkninger på aktiviteten til oppregulert TFS som c-Fos, c-Jun, c-myc, PPAR-gamma1, Smad3, Egr-1, og c-Ets-2. C-myc og PPAR-gamma1 var begrenset til det transgene og svulsten nettverk, henholdsvis. Hver faktor integrerer signaler fra flere oppstrøms molekyler med endret uttrykk. Interessant, velkjent kreft-assosiert TFS som c-Fos, c-Jun, Smad3, og c-Ets-2 viste heller konstante nivåer av oppregulering hele tumorigenesis. Videre er et relativt høyt antall både aktiverende og hemmende reaksjoner mål p53, som var blottet for påvises differensial uttrykk i enten progresjon tilstand.

En kaskade involverer VCAM-1, alfa-4-integrin, og IAP ble funnet spesielt i den transgene nettverk (figur 4). Alpha4-inte viser progresjon state spesifikk regulering med oppregulering i transgene celler og nedregulering i tumorceller (Tabell S3). Integriner er knyttet til vevsinvasjon ved hepatokarsinom celler [9], og å spille en rolle i apoptose [10]. BMP7, en tumor nettverksspesifikt molekyl, kan fungere som transkripsjonsfaktor, og kan som sådan bidra til oppregulering av c-Myb [11], så vel som c-Fos, idet sistnevnte eventuelt ved andre midler [12]. BMP7 ble tidligere rapportert til å delta i reguleringen av apoptose i vaskulære glatte muskelceller [13]. Gitt deres tilknytning til apoptose og deres progresjon state-spesifikke uttrykk profiler, alpha4-integrin og BMP7 kan representere bestanddeler av bryter mekanismer for kreftutvikling.

Nettverks klynger avsløre regulatoriske kretser som kan utforskes for nye terapeutiske intervensjoner. Faktisk er PPAR-gamma-antagonister etterforskes som behandling av ulike kreftformer, inkludert leverkreft. Regulatoriske kaskader rettet mot PPAR-gamma gjennom oppstrøms kinaser og fosfataser, som M3 /6, JNK1, MEKK2, MKP3, MEK2, eller ERK2, hvorav M3 /6, MEKK2, og MFP-3 ble indusert ved kreftutvikling, foreslår flere muligheter for narkotika utvikling. Videre liganden av insulin og insulin-lignende reseptorer, IGF-2, ble sterkt oppregulert i tumorceller, mens det var moderate endringer i transgene celler (ikke detekteres ved differensial-ekspresjon analyse). Den potensielle rolle til denne ligand i autokrin regulering av kreftcellevekst ble tidligere diskutert i litteraturen [14] og ytterligere analysert i vårt studium (se nedenfor).

Promoter analyse og identifikasjon av regulatoriske sekvenser

Transkripsjonsfaktorer faktorer~~POS=HEADCOMP er viktige bidragsytere til koordinerte genuttrykk endringer som de som ble observert i studien data. Det er en standard metode for å teste for overrepresentasjon av TF bindingsseter i arrangører av coregulated gener versus en bakgrunn av arrangører. Vi kvantifisert bindingssetet berikelse ved 0.01-kvantil av forholdet mellom to Beta distribusjoner modellering odds ratio på spådd bindingssteder og arrangører og forgrunn og bakgrunn gensettene. Den 0.01-quantile verdi, i det følgende betegnet

q-verdi

anslår verdien av odds ratio, slik at den egentlige forholdet er høyere med 99% sannsynlighet (se Methods). For hver av de 578 TRANSFAC PWMs, algoritmen startet med en lav PWM poengsum terskel (P-verdi 0,05) og iterativt justert cut-off (ved å øke verdien) for å maksimere q-verdi.

Binding områder var spådd av MATCH i promotorområdene som dekker -1000-100 i forhold til TSS. Vi konstruerte egne bakgrunns sett for transgene og kreftceller ved tilfeldig prøvetaking 1000 gener med fold endringer mellom 0,9 og 1,1 i de respektive progresjon tilstand. Følgende forgrunnen settene ble analysert: oppregulering (Tabell 1: setter 1-3 og 3-5), spesifikk oppregulering (Tabell 1: sett 1 og 5), nedregulering (Tabell 1: setter 6-8 og 8-10), og spesifikk downregulation (Tabell 1: sett 6 og 10). I tillegg ble bindingssetet anrikning testet i promotorer av oppregulert gener assosiert med cellesyklus og av downregulated gener assosiert med lipidmetabolisme.

i figur 6, q-verdiene for TRANSFAC motiver som er optimalisert for transgene forgrunnen sett er plottet mot q-verdier på tilsvarende svulst i forgrunnen sett. Videre hentet vi de beste PWMs bestilt av q-verdiene i tabell S4. Identifikatorer av TRANSFAC matriser med prikker er markert i figur 6 er fet-skrev i tabell S4. Utvinning av matriser fulgt regelen for å vise de 15 PWMs, eller alle med minst to ganger berikelse i enten transgen eller svulst sett, eller alle PWMs uthevet i Figur 6, avhengig av hva som førte til det største antall motiver. Vi har også hentet transkripsjonsfaktorgener (tabell S5) i henhold til identifiserte PWMs (understreket i tabell S4) og utført oppstrøms nettverksanalyse med transkripsjonsfaktorene sett (se nedenfor).

Hver prikk representerer en TRANSFAC bindingssete (= sekvens motiv) posisjonert ved gangers anrikning i transgene (x-aksen) og tumor (y-aksen) i forgrunnen sett. Quantile verdier større enn 1 indikerer bindingssetet berikelse. Flere motiver er markert som ble flyttet bort fra diagonalen som tyder på annet viktigheten av tilsvarende TFS for regulering i enten transgene eller svulst stater. Vær så snill, se tekst for nærmere beskrivelse. A) Analyse av bindingssetet berikelse i alle ned regulerte gener B) Analyse av bindingssetet enrichments i spesifikt ned regulerte gener av enten transgene eller krefttilstander C) Analyse av bindingssetet berikelse i alle opp regulerte gener D) Analyse av bindingssetet enrichments i spesielt opp regulerte gener som er av enten transgene eller tumortilstander E) Analyse av bindingssetet anrikninger på opp regulerte cellesyklus-gener F) Analyse av bindingssete anrikninger i ned-regulert lipidmetabolismen gener.

Som et resultat promoter analysen avdekket TF motiver spesifikt, eller mer articulately overrepresentert i transgene eller svulst i forgrunnen sett samt motivene med felles berikelse både progresjon stater. I 5 av 6 forgrunnen settene, ble POU motivene sterkere assosiert med det transgene tilstand enn med tumor tilstand (figur 6A-E). Denne forskjellen var mest uttalt i analyser av nedregulert (figur 6A) og spesifikke downregulated gensettene (Figur 6b), hvor prikkene representerer POU matriser (blå diamanter) befinner seg langt vekk fra masse poeng. Spesielt områder av noen POU motivene var også mer enn to ganger beriket i arrangører av downregulated gener i svulsten. Oct1 matriser var de beste rangerte motivene i nedregulert og spesifikke downregulated genene i svulsten (tabell S4). Men arrangører av oppregulert gener ble påviselig beriket med POU steder i transgene staten bare (figur 6C-E). Disse resultatene tyder på at POU faktorer bidro til overgangen fra transgene til tumor tilstand. Videre kan deres aktivitet representere et viktig årsak til nedregulering observerte hendelser. Blant de POU transkripsjonsfaktorer representert ved matriser identifisert i analysene, uttrykket profilen til Pou5f1 (Oct4) lignet vel den observerte progresjon-state spesifikk anriking av sine bindingssteder (tabell S5). Den Pou5f1 genet viste en høy fold endring (2,75) i den transgene staten, som hadde gått ned i svulsten tilstand (endring 1,70). Faktisk er det Pou5f1 genet spesifikt uttrykt i embryonale stamceller og i tumorceller, men ikke i celler av differensiert vev [15]. Transkripsjonsfaktorer med en gaffelhodedomene viste også sammenheng med den transgene staten. Dette signalet ble best observert i oppregulering og cellesyklus gensettene (Figur 6Cand E), men subtile berikelse i transgene arrangører kan også påvises i bestemte downregulation (figur 6B) og spesifikk oppregulering, hvor FREAC2 motiv rangert blant de 15 beste PWMs ( Tabell S4). I oppregulering sett, Foxd3 bindingssteder viste den sterkeste signalet etter Oct1 områder (tabell S4). Dette ville støtte en potensiell rolle Oct4, som corepression gjennom overlappende bindingsseter av Oct4 og Foxd3 ble tidligere rapportert [16]. Ifølge uttrykk målinger, ble Foxd3 potensielt nedregulert i begge progresjon stater (tabell S5), men målt uttrykk forskjellene ikke var statistisk signifikant. I stedet paralleller Foxc1 uttrykk sterkere berikelse av gaffelhodebindingsseter i transgene promoter sett, så det er spesielt oppregulert i tidlig progresjon tilstand (Tabeller S1 og S5).

Arrangører av oppregulert genene i svulsten ble assosiert med bindende områder av cellesyklus regulatorer for eksempel AP1-lignende faktorer, STAT og E2F (figur 6C-E), hvorav Atf3, juni, og E2f3 var signifikant oppregulert i begge transgene og tumorceller (tabellene S1 og S5). Dette funnet støtter sterkere regulering av cellesyklus prosesser i svulsten oppdages av komparativ GO analyse. Analysen av cellesyklus genet arrangører tyder E2F faktorer som de viktigste regulatorer i begge stater, mens en tendens mot høyere Q-verdier i svulsten settet ble observert i flere E2F motiver (Figur 6E). Spesielt ble den Myc-assosierte sink-finger-proteinet påvist i den transgene cellesyklusen gen sett (tabellene S4 og S5), som indirekte antyder at Myc påvirket cellesyklusregulering i transgene celler, men ikke eller i mindre grad i tumorceller. Dette vil bli støttet av uttrykket profilen til Myc med betydelig oppregulering i den tidlige staten og subtile eller fraværende oppregulering i svulsten.

Til slutt, lipidmetabolismen gensettene vise sterk sammenslutning av HNF6 (Onecut1) og PPAR-gamma med svulsten tilstand (figur 6F). Av disse ble HNF6 signifikant nedregulert i tumoren, mens PPAR-gamma oppviste en progresjon tilstand bestemt profil med nedregulering i den transgene tilstand og betydelig oppregulering i tumoren.

Selv om mange av de tidligere nevnte transkripsjonsfaktorer er velkjente proto -oncogenes, for eksempel Jun, Myc, eller E2f3, og koblingen mellom HNF6, PPARy og lipidmetabolismen er forståelig, andre faktorer avslørt av vår analyse, er nye i forhold til sin rolle i leveren kreftutvikling. Bindende områder av Kaiso (Zbtb33) ble sterkest overrepresentert i downregulated kreftgener. Kaiso ble vist til taushet tumorsuppressorgener i tykk- og endetarmskreft [17], og dens rolle i kreft ble tidligere anmeldt [18]. Videre ble motiver av HMG boks faktorer forbundet med transgene gensettene i nedregulering (figur 6A, LEF1 PWMs) og spesifikk oppregulering (figur 6D, SRY). [29].

Legg att eit svar